最小二乘拟合直线真的没问题么?

一幅封面插画

偶然间我看到下图中的插画(下图)

Cambridge University Press 的一本书


一下子想起很多事情, 记得有次需要求解某个椭圆前后位置的旋转角, 已知了椭球边上点的坐标,于是我就想: 我用最小二乘不就可以得到椭圆的长轴了吗, 然后再由最小二乘拟合的直线斜率一下子就可以得到椭圆旋转的角度. 听起来似乎很完美, 结果最小二乘拟合后我得到上图中的实线(其实我想得到的是虚线). 另外, 在本科学习最小二乘拟合直线的时候, 一直存有疑惑为什么不是最小化 点到直线的距离, 而是直接  kx+b-y . 直到后来仔细分析过才发现里面其实大有乾坤! 下文将慢慢道来....


问题的提出&最小二乘的疑问


Fig 1. 已知一些带噪声的数据集, 用直线来拟合该数据集


已知 N 个点数据坐标  \left(\begin{array}{c} x_i \\ y_i \end{array}\right),~~i=1,\cdots,N 利用矩阵表示 \boldsymbol{D}= \left[\begin{array}{cc} x_1 & y_1 \\ x_2 & y_2 \\ \vdots&\vdots\\ x_N & y_N \end{array}\right] ,

这些数据集大致呈现出一条直线的形态, 甚至这些数据本身就是呈一条直线, 只不过在测量、观察或计算过程中带入大量噪声, 使得这些数据并不严格呈现一条直线状. 那么如何找到一条直线 y=kx+b

使得这些数据点集和该直线最为"贴合"?

Fig 2. "找到"一条直线使得定义的误差("红线")的平方和最小

其实用泛泛的文字很难准确描述很多东西, 此时我们需要严格定义何为"贴合". 首先"贴合"即点和直线的某种"距离"(范数)之和最小. Fig 2中给出了两种"距离"的定义: 左图为竖直距离, 右图为垂直距离. 显然最小二乘法是使得点和直线在"竖直"距离下最贴合, 然而不知大家在学习的时候有没有这个疑问, 明明是右边的"垂直"距离更直观有意义!

某一种解释: 实际问题中,  x 是没有误差的固定值,只有  y 才是有误差的观测值,所以在只考虑  x 的误差情况下, 竖直的距离更有意义一些.

但不知道有没有人想过这个问题, 如果严格按照Fig 2右图中的距离来拟合直线会怎样, 以及那又该怎么求? 毕竟没有了最小二乘那么方便的求解公式, 我将在下文中仔细解答, 首先回顾最小二乘方法, 再来给出究竟如何求解"垂直"距离下的拟合直线.



最小二乘(least square)拟合直线

最小二乘拟合直线应该是大学里必修的知识点, 不过很多同学应该都是为了考试背一下公式、做大作业网上Download一份MATLAB代码交差而已, 下文就帮助大家回忆一下究竟公式怎么求来的, 以及最小二乘拟合直线的一个彩蛋: 拟合的直线过数据点集的重心! 有兴趣可以自己先推到一下看看.

首先由上文所述, 我们定义"贴合"所采用的距离为"竖直"距离, 即如Fig 3所示, 即

d_i=kx_i+b-y_i,\qquad~i=1,2,\cdots,N

Fig 3. 点到直线的竖值距离


则直线拟合可写成如下优化问题:

优化问题: 找到斜率  k 和截距  b

使得 \min_{k,b}{(d_1^2+d_2^2+\cdots+d_N^2)} 成立.

由距离 d_i 的定义

d_1^2+d_2^2+\cdots+d_N^2 = (kx_1+b-y_1)^2+(kx_2+b-y_2)^2+\cdots+(kx_N+b-y_N)^2

优化问题等价于

k,b = arg\min_{k,b} \sum_{i=1}^{N}{d_i^2} = arg\min_{k,b} \sum_{i=1}^{N}{(kx_i+b-y_i)^2}

换成矩阵描述形式, 并定义系数矩阵 \boldsymbol{A}

\boldsymbol{d}= \left(\begin{array}{c} d_1 \\ d_2\\ \vdots\\ d_N \end{array}\right) = \left[\begin{array}{cc} x_1 & 1 \\ x_2 & 1 \\ \vdots&\vdots\\ x_N & 1 \end{array}\right] \left(\begin{array}{c} k \\ b \end{array}\right) -\left(\begin{array}{c} y_1 \\ y_2\\ \vdots\\ y_N \end{array}\right)=:\boldsymbol{A}\boldsymbol{k}-\boldsymbol{y}


原优化问题又等价于k,b = arg\min_{\boldsymbol{k}} {\|\boldsymbol{d}\|} = arg\min_{\boldsymbol{k}}{\boldsymbol{d}^T\boldsymbol{d}} = arg\min_{\boldsymbol{k}}{(\boldsymbol{k}^T\boldsymbol{A}^T\boldsymbol{A}\boldsymbol{k} -2\boldsymbol{y}^T\boldsymbol{A}^T\boldsymbol{k}+\boldsymbol{y}^T\boldsymbol{y} )}

求导可求得最优化问题等价于方程组

\Leftrightarrow \boldsymbol{A}^T\boldsymbol{A}\boldsymbol{k}= \boldsymbol{A}^T\boldsymbol{y}

其中左端矩阵和右端向量分别为

\boldsymbol{A}^T\boldsymbol{A}=\left[\begin{array}{cc} x_1^2+\cdots+x_N^2 & x_1+\cdots+x_N\\ x_1+\cdots+x_N & 1+\cdots+1\\ \end{array}\right] =\left[\begin{array}{cc} \sum_{i=1}^{N}{x_i^2} & \sum_{i=1}^{N}{x_i} \\ \sum_{i=1}^{N}{x_i} & N\\ \end{array}\right]

\boldsymbol{A}^T\boldsymbol{y}=\left(\begin{array}{c} x_1y_1+\cdots+x_Ny_N \\ y_1+\cdots+y_N \\ \end{array}\right)=\left(\begin{array}{c} \sum_{i=1}^{N}{x_iy_i} \\ \sum_{i=1}^{N}{y_i} \\ \end{array}\right)

最小二乘法拟合直线的待求方程组如下

\left[\begin{array}{cc} \sum_{i=1}^{N}{x_i^2} & \sum_{i=1}^{N}{x_i} \\ \sum_{i=1}^{N}{x_i} & N\\ \end{array}\right]\left(\begin{array}{c} k \\ b \end{array}\right)=\left(\begin{array}{c} \sum_{i=1}^{N}{x_iy_i} \\ \sum_{i=1}^{N}{y_i} \\ \end{array}\right)

有意思的事是上面方程组的第二个方程

k \sum_{i=1}^{N}{x_i}+Nb= \sum_{i=1}^{N}{y_i} 即 \left(\frac{1}{N}\sum_{i=1}^{N}{x_i}\right)k+b= \frac{1}{N}\sum_{i=1}^{N}{y_i}

换言之, 重心  x_0=\frac{1}{N}\sum_{i=1}^{N}{x_i} , y_0=\frac{1}{N}\sum_{i=1}^{N}{y_i} 必定经过该拟合直线(彩蛋).



主成分分析(Principal Component Analysis)拟合直线

在"垂直"距离(Fig 2右图)下求解拟合直线, 我在下文中称为pca方法拟合直线, 至于为什么, 大家可以先看看pca相关的知识, 或者以后有空我在专栏里介绍.

由上一节最小二乘法的分析, 我们不妨假设数据集的重心就在原点, 或者做数据的平移使得该条件成立

x_i=x_i-\frac{1}{N}\sum_{i=1}^{N}{x_i},\qquad y_i=y_i-\frac{1}{N}\sum_{i=1}^{N}{y_i},\qquad i=1,2,\cdots,N

因此在拟合该过原点直线的时候, 我们仅仅需要考虑斜率  k (如Fig 4.)

换个角度, 如果我们知道了该直线的单位法向量  \boldsymbol{n}=(n_1,n_2)^T ,则斜率也就知道了, 由此问题转化为如何确定单位向量  \boldsymbol{n} . 下一步就是如何求得各个数据点到假定直线之间的最短距离, 这也是为什么需要引入直线的法向量.

Fig 4. 重心在原点时求点到直线的垂直距离


如Fig 4所示, 对于点  (x_i,y_i)^T , 该点的坐标向量与直线法向量  \boldsymbol{n} 的内积正好等于该点到直线的距离(同向为正, 反向为负), 即

h_i = \left(\begin{array}{c} x_i \\ y_i \end{array}\right)\cdot \boldsymbol{n} =\left(\begin{array}{c} x_i \\ y_i \end{array}\right)\cdot \left(\begin{array}{c} n_i \\ n_i \end{array}\right)= \left(\begin{array}{cc} x_1&y_1 \end{array}\right)\left(\begin{array}{c} n_i \\ n_i \end{array}\right),\qquad i=1,2,\cdots,N



优化问题: 找到 单位法向量 \boldsymbol{n} ,

使得 \min_{\|\boldsymbol{n}\|=1}{(h_1^2+h_2^2+\cdots+h_N^2)} 成立.

带入距离 h_i 的计算公式, 得

\boldsymbol{n} = arg\min_{\|n\|=1}{\left(\left| \left(\begin{array}{c} x_1 \\ y_1 \end{array}\right)\cdot \boldsymbol{n} \right|^2+\cdots+\left| \left(\begin{array}{c} x_N \\ y_N \end{array}\right)\cdot \boldsymbol{n} \right|^2 \right)}

由矩阵相关的计算

\boldsymbol{n} = arg\min_{\|\boldsymbol{n}\|=1}{\sum_{i=1}^{N}{\left| \left(\begin{array}{c} x_i \\ y_i \end{array}\right)\cdot \boldsymbol{n} \right|^2}} = arg\min_{\|\boldsymbol{n}\|=1}{\sum_{i=1}^{N}{\boldsymbol{n}^T \left(\begin{array}{c} x_i \\ y_i \end{array}\right) \left(\begin{array}{cc} x_i & y_i \end{array}\right) \boldsymbol{n}}}

求和号里的结合律, 并定义数据集矩阵

\boldsymbol{n}= arg\min_{\|\boldsymbol{n}\|=1}{\boldsymbol{n}^T \left( \sum_{i=1}^{N}{\left(\begin{array}{c} x_i \\ y_i \end{array}\right) \left(\begin{array}{cc} x_i & y_i \end{array}\right)}\right) \boldsymbol{n}} =:arg\min_{\|\boldsymbol{n}\|=1}{\boldsymbol{n}^T\boldsymbol{P}\boldsymbol{n}}

其中定义的矩阵为数据集  \boldsymbol{D} 的转置乘以本身:

\boldsymbol{P} = \boldsymbol{D}^T\boldsymbol{D}= \left[\begin{array}{cc} x_1 & y_1 \\ x_2 & y_2 \\ \vdots&\vdots\\ x_N & y_N \end{array}\right]^T \left[\begin{array}{cc} x_1 & y_1 \\ x_2 & y_2 \\ \vdots&\vdots\\ x_N & y_N \end{array}\right] =\left[\begin{array}{cc} \sum_{i=1}^{N}{x_i^2} & \sum_{i=1}^{N}{x_iy_i}\\ \sum_{i=1}^{N}{x_iy_i} & \sum_{i=1}^{N}{y_i^2}\\ \end{array}\right]

注意到矩阵  \boldsymbol{P} 是对称矩阵, 因此对矩阵  \boldsymbol{P} 做svd分解(也可视作特征分解):

\boldsymbol{P} = \boldsymbol{U}\boldsymbol{\Sigma}\boldsymbol{U} ^T

其中  \boldsymbol{U} 是正交矩阵, \boldsymbol{\Sigma}=diag(\sigma_1, \sigma_2) 对角矩阵 ( \sigma_1\geq\sigma_2 ) , 则有:

\min_{\|\boldsymbol{n}\|=1}{\boldsymbol{n}^T\boldsymbol{P}\boldsymbol{n}}~~\Leftrightarrow~~ \min_{\|\boldsymbol{n}\|=1}{\boldsymbol{n}^T\boldsymbol{U}\boldsymbol{\Sigma}\boldsymbol{U}^T\boldsymbol{n}} ~~\Leftrightarrow~~ \min_{\|\boldsymbol{n}\|=1}{\left(\boldsymbol{U}^T\boldsymbol{n}\right)^T\boldsymbol{\Sigma} \left(\boldsymbol{U}^T\boldsymbol{n}\right)}

数据集为固定值, 则其数据集矩阵的svd分解后的  \boldsymbol{U} 也为固定值, 再因为  \boldsymbol{U} 是正交矩阵, 因此假设新的单位长度向量

\boldsymbol{s} = \left(\begin{array}{c} s_1 \\ s_2 \end{array}\right):= \boldsymbol{U}^T\boldsymbol{n}

接下来, 原优化问题等价为:

\min_{\|\boldsymbol{n}\|=1}{\boldsymbol{n}^T\boldsymbol{P}\boldsymbol{n}}~~\Leftrightarrow~~\min_{\|\boldsymbol{s}\|=1} \left(\begin{array}{cc} s_1 & s_2 \end{array}\right) \left[\begin{array}{cc} \sigma_1 & 0 \\ 0 & \sigma_2\\ \end{array}\right] \left(\begin{array}{c} s_1 \\ s_2 \end{array}\right)

不难得知

\left(\begin{array}{cc} s_1 & s_2 \end{array}\right) \left[\begin{array}{cc} \sigma_1 & 0 \\ 0 & \sigma_2\\ \end{array}\right] \left(\begin{array}{c} s_1 \\ s_2 \end{array}\right) = s_1^2\sigma_1+s_2^2\sigma_2=\sigma_2+(\sigma_1-\sigma_2)s_1^2

注意到其中优化问题的变量 s_1^2+s_2^2=1 \sigma_1\geq\sigma_2 只与原始数据相关的固定值, 因此 当且仅当  s_1=0,~~s_2=1 时取得最小值, 即

\boldsymbol{n} = \boldsymbol{U}\left(\begin{array}{c} 0 \\ 1 \end{array}\right) 时 \min_{\|n\|=1}{\left(\| \left(\begin{array}{c} x_1 \\ y_1 \end{array}\right)\cdot \boldsymbol{n} \|^2+\cdots+\| \left(\begin{array}{c} x_N \\ y_N \end{array}\right)\cdot \boldsymbol{n} \|^2 \right)} 成立取最小值

即直线的法向方向应该为数据集矩阵 \boldsymbol{D}^T\boldsymbol{D}= \boldsymbol{U}\boldsymbol{\Sigma}\boldsymbol{U} ^T 的最小特征值对应的特征方向!

最后, 不难得知直线的斜率  k=-n_1/n_2 , 此外再将数据点的重心并不在原点, 即该直线通过数集的重心, 得到  b= \frac{1}{N}\sum_{i=1}^{N}{y_i}-\left(\frac{1}{N}\sum_{i=1}^{N}{x_i}\right)k .

这其实就是在数据降维中常用的主成分分析方法!



数值测试对比

为验证上文的方法和结论等, 我测试了三组数据:

  1. 数据基本在一条直线附近, 带有轻微扰动
  2. 数据扰动较大, 略呈斜扁椭圆状
  3. 数据扰动很大, 呈斜椭圆状

以下图

对应测试数据1
对应测试数据2
对应测试数据3

不难发现, 在绝大多数的直线拟合问题下(数据1), 两种"距离"定义下拟合的结果(ls和pca)几乎重合, 均很好拟合了原数据.然而, 在斜椭圆数据(可以联系协方差相关知识)下, "垂直"距离求解(pca)比传统的"竖直"距离(最小二乘)求解要好很多, 如上图以及本文最初的封面插画所示.

因此对于标题的以为, 我想回答是: 嗯, 没有问题, 有问题的是数据..........



测试代码

测试平台为Anaconda, 环境为python2

"""  Created on Thu May  3 21:48:26 2018    @author: HSSheng  """  import numpy as np  import matplotlib.pyplot as plt    # creat test data===========================================  # data0: random in [-1,1]x[-1,1]  data0 = np.random.rand(1000,2)  data0 = 2*data0-1  # data1: data0 cutted in ellipse  data1 = np.empty((1000,2))  count = 0  for i in range(np.size(data0,0)):      if data0[i,0]**2+4.*data0[i,1]**2<1:          data1[count,:] = data0[i,:]          count = count+1  data1 = data1[:count,:]  # data: data1 rotation and displacement  theta = np.pi/5  rotMatrix = np.array([[np.cos(theta),np.sin(theta)],                        [-np.sin(theta),np.cos(theta)]])  data = np.dot(data1,rotMatrix)  data[:,0] += 2  data[:,1] += 3  # Least square Method======================================  N = np.size(data,0) # total number of data  coeMatrix = np.vstack((data[:,0],np.ones(N))).transpose()  coeRhs = data[:,1]  A = np.dot(coeMatrix.transpose(),coeMatrix)  f = np.dot(coeMatrix.transpose(),coeRhs)  kb = np.linalg.solve(A, f)  k = kb[0]  b = kb[1]  # data for plot  x_ls = np.linspace(1,3)  y_ls = x_ls*k+b  # PCA method===============================================  # move center to zero point  dataHomo = data.copy()  dataHomo[:,0] -= np.sum(data[:,0])/N  dataHomo[:,1] -= np.sum(data[:,1])/N  # data matrix  dataMatrix = np.dot(dataHomo.transpose(),dataHomo)  u, s, vh = np.linalg.svd(dataMatrix, full_matrices=True)  n = u[:,-1]  k2 = -n[0]/n[1]  b2 = np.sum(data[:,1])/N-k2*np.sum(data[:,0])/N  # data for plot  x_pca = np.linspace(1,3)  y_pca = x_pca*k2+b2      plt.plot(data[:,0],data[:,1],'.')  plt.legend('data', shadow=True,)  plt.plot(x_ls,y_ls,linewidth=3)  plt.legend('least square', shadow=True,)  plt.plot(x_pca,y_pca,linewidth=3)  plt.legend(('data', 'least square','pca'), shadow=True,)    plt.axis('equal')  plt.show()  



来源:知乎 www.zhihu.com
作者:Dr.Sheng

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。 点击下载

如何区别皮肤过敏和敏感性皮肤?

一、敏感性皮肤

敏感性皮肤目前不少见,而且以女性最多见。最常见的发病部位是面部,在受到一些刺激,比如说物理、化学、精神刺激等以后皮肤出现烧灼感,刺痛,瘙痒、紧绷感这些主观的一些症状,同时有或者没有红斑、鳞屑、毛细血管扩张等的客观指证。

敏感性皮肤,实际上就是我们皮肤处在一个亚健康状态,是一种皮肤感觉综合征,皮肤处于一种高反应的状态。我们正常人在常规的这些刺激时是不会出现敏感性肌肤所表现出来的不舒服的感觉,有没有红斑也不是敏感性肌肤的必要条件。我们也要知道,敏感性皮肤可以累及全身的任何部位,只不过最常见的只是面部皮肤而已。

在我们国家,敏感性肌肤的发病率约为36.1%。敏感性肌肤的发生原因非常复杂,是内因和外因共同作用的结果,内因包括遗传、年龄、性别、激素水平、精神压力等,外因包括季节交替,温度变化,日晒等物理因素,也包括使用不当的化妆品、清洁用品、消毒产品以及现在的空气污染的化学因素,也包括一些患者长期大量的外用糖皮质激素,或者外用一些刺激性的药物,甚至在某一些美容激光治疗术后出现。

另外,某些皮肤病可以出现敏感型皮肤,也就是说,敏感性皮肤可以继发于这些些皮肤病,比如说特应性皮炎,玫瑰痤疮,痤疮,接触性皮炎,湿疹等等。因此,临床上治疗这些皮肤病的时候要考虑到敏感性皮肤的问题。

目前认为,敏感性皮肤的发生是一种累及皮肤屏障-神经血管功能-免疫炎症的复杂过程,是内因和外因共同作用下,皮肤屏障功能受损,导致感觉神经传入信号增加,皮肤对外界刺激的反应性增强,进而引起皮肤的免疫炎症反应,进而导致皮肤出现了灼热,刺痛,搔痒等不舒服的症状,持续时间可以达到数小时,常常不能耐受普通的护肤品。

要想诊断敏感性皮肤,那么首先患者要有这些主观的不舒服的症状,另外还需要排除继发敏感性皮肤的一些皮肤病,比如刚才谈到的特应性皮炎或者玫瑰痤疮等等。可以做一些辅助检查,比如辣椒素试验或者乳酸刺激试验,也可以测试经皮水分丢失等来评估皮肤屏障功能是否受损。

二、皮肤过敏

皮肤过敏,实际上就是皮肤的变态反应,或者称之为超敏反应,是对各种各样的过敏原引起的异常的免疫反应,结果导致我们皮肤组织出现了炎症或者器官功能障碍,最常见的是皮肤,呼吸系统,以及消化道。而过敏性皮肤病就是指各种过敏原通过变态反应机制引起的皮肤病,包括皮炎湿疹类的皮肤病,荨麻疹类的皮肤病,药物变态反应,食物变态反应以及其他。

从这个概念我们可以看出来过敏反应至少要包括四个要素,也就是过敏原、易感者、变态反应机制和过敏结果。

过敏原是过敏性疾病的病因,而过敏原的种类非常非常复杂,有植物性的,有动物性的,有微生物性的,也有化学性的,通常我们把它分为四类,即吸入性过敏原,食入性过敏原,注射性过敏原和接触性过敏原,祛除过敏原可以根治过敏性疾病;

并不是每一个人都可能会发生过敏反应。有一些人特别容易出现过敏反应,也就是说遗传因素在其中起着重要的作用,加上环境的因素也可能起着作用的作用,易感者我们称为过敏体质。

变态反应的发病机制包括四种最常见的变态反应,也就是一型、二型、三型、四型,分别对应者不同的疾病。比如我们皮肤科最常见的荨麻疹就是一型变态反应;新生儿溶血是二型过敏反应;过敏性紫癜是三型变态反应;湿疹、接触性皮炎是四型变态反应。当然有一些皮肤病,包括这四种的变态反应比如说药物过敏。


由于皮肤过敏的时候,涉及到非常复杂的炎症反应和不同的化学介质,而我们皮肤科最常用的止痒药物是抗组胺药物是针对组胺进行抗炎反应的,用来对付荨麻疹效果还是不错的,但是其他的一些过敏反应,比如过敏性紫癫,湿疹,接触性皮炎,药物过敏的时候,因为它们炎症介质更加复杂,不仅仅是组胺,因此口服抗组胺药物,可能这个时候就不是特别理想了,还需要外用或者口服糖皮质激素来达到抗炎的作用。


参考文献:
1.中国敏感性皮肤诊治专家共识,2017
2.瘙痒研究国际论坛敏感性皮肤兴趣组《敏感性皮肤定义专家共识》解读
3.湿疹皮炎与皮肤过敏反应的诊断和治疗,主编:李邻峰

来源:知乎 www.zhihu.com
作者:皮肤科徐宏俊医生

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。 点击下载

此问题还有 6 个回答,查看全部。

用“真人真事”拍摄影视剧 要取得许可吗?

本文作者:中闻律师事务所合伙人 贾虹律师

经常有客户询问:想以新闻报道的事件或某特定人物的真实经历("真人真事")为素材,拍摄影视剧,这需不需要当事人的许可呢?

新闻报道事件或已公开的事实属于公有领域。也就是说,每个人都可以基于已经发生并公开的公有领域事件进行文学创作、影视拍摄等,并不需要取得当事人的著作权许可。

现实中,也存在大量的基于新闻或真实事件创作的作品,比如:严歌苓的小说《老师好美》,即是从贵阳六中师生恋杀人事件的社会新闻中,提取相关主线和元素创作完成。


由于影视剧投入都比较大,基于"真人真事"进行影视剧制作时,按照行业惯例,影视公司通常会尽量与当事人提前签署书面文件,以取得当事人的拍摄许可和明确作品著作权归属。

原因主要为:

第一、避免因当事人不知情而引起不必要的纠纷

文学或影视作品讲究故事情节和戏剧冲突,"故事"需要吸引人。如果严格按照"真人真事",大多数情况下很难创作出符合影视剧行业要求的优秀作品,这就需要在事实中加入虚构情节进行润色或再创作,如果情节中涉及到当事人的婚恋、亲情等,不可避免的会触及或涉及当事人的隐私事件,而事实与虚构融合后,又可能与当事人的认知、评价不一致,从而引起当事人的不满,甚至导致当事人感觉被侮辱、被诽谤或名誉受损等。

虽然当事人对已进入公有领域的事实、事件或新闻并不拥有著作权,但是,当事人是有权利保护自己的隐私不受侵犯,防止他人侮辱、诽谤和保障自己名誉不受损害。

《最高人民法院关于审理名誉权案件若干问题的解答》第九问中,即明确答复:

"描写真人真事的文学作品,对特定人进行侮辱、诽谤或者披露隐私损害其名誉的;或者虽未写明真实姓名和住址,但事实是以特定人或者特定人的特定事实为描写对象,文中有侮辱、诽谤或者披露隐私的内容,致其名誉受到损害的,应认定为侵害他人名誉权"。

前几年,章子怡在参演电影《梅兰芳》后,想拍摄《孟小冬传》,而《孟小冬传》的内容会牵涉到梅兰芳与孟小冬的感情问题,这些事件会涉及到梅兰芳的隐私和名誉。梅兰芳的继承人和相关方对拍摄《孟小冬传》不支持和不赞成,各方面关系无法协调,在此情况下,如果强行拍摄,不仅涉及法律问题,还会有不良影响,所以,章子怡最终放弃了拍摄。

第二、基于影视剧立项报批和发行授权的需要

影视剧拍摄前,制片方需要先对影视剧进行立项(注:制作电视剧备案公示初审或电影剧本(梗概)备案)。

如果影视剧主要人物和情节涉及国家安全、外交、民族、宗教、军事、公安、司法、历史名人和文化名人、敏感历史事件、英模、先进人物、荣誉称号获得者等方面内容的,都归类为特殊题材的影视剧,其立项的申请文件提交要求较一般题材更为丰富。如特殊题材影视剧内容涉及真实人物,审批机构会要求制片方提供原型人物本人或亲属同意拍摄的书面授权原件作为申请文件

此外,"真人真事"影视剧拍摄完成后,需要通过院线、电视台、网络平台等发行,在发行授权过程中,有的平台也会出于严谨考虑,要求提供相关原型人物的授权文件。

第三、在特殊情况下,基于明确作品著作权归属的需要

一般情况下,制片方基于新闻事件或公开事实新创作的作品,其著作权归属于制片方。

但是根据《最高人民法院关于审理著作权民事纠纷案件适用法律若干问题的解释》第十四条规定,有一类情况较为特殊:"当事人合意以特定人物经历为题材完成的自传体作品,当事人对著作权权属有约定的,依其约定;没有约定的,著作权归该特定人物享有,执笔人或整理人对作品完成付出劳动的,著作权人可以向其支付适当的报酬。"

所以,如果要基于特定人物口述或介绍,并以特定人物真实经历,创作和拍摄特定人物自传体作品时,制片方不仅要取得拍摄许可,还须事先明确约定作品的著作权归属。此处还应注意的是,上述第十四条规定的自传体作品,是指通过第一人称或第三人称叙述特定人物的生平事迹或著作,自传体作品并不仅局限于第一人称。

由此,为避免疏漏和日后隐患,"真人真事"影视剧制作,特别是自传体类的"真人真事"影视剧制作,建议与当事人提前签署书面文件,并明确约定相关素材使用和著作权归属事项。



来源:知乎 www.zhihu.com
作者:中闻律师事务所

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。 点击下载

前沿速报||地球上的水形成于什么时候?月亮告诉你答案。

从月球上寻找地球失落的历史。 


地球上的水是什么时候形成的?这是科学家们至今还在争执不休的课题。不过,过去人们普遍认为,起码在地球诞生(约46亿年前)最初的几亿年里,应该不太可能有水存在,因为那时候内太阳系的几个岩质大天体都在经历着剧烈的小天体撞击,完全是一个个熔融炙热的冶炼炉。那么很自然地,人们认为地球上的水应当形成于晚些时候,怎么也不能比45亿年前更早了吧

然而近日,英国开放大学的Greenwood及其同事们通过测量地球和月球的岩石样本,发现地球上的大部分水可能在45亿年前就存在了,这一结果发表于2018年3月28日的Science Advance:Oxygen isotopic evidence for accretion of Earth's water before a high-energy Moon-forming giant impact

咦?为什么科学家们可以通过月球的岩石找到地球上水含量变化的线索呢?这是因为月球和地球有着不可分割的"近亲"关系。这一切还得从月球的起源说起,那是很久很久以前的一天……


飞来横祸的一天

45亿年前的一天,一颗火星大小的天体从天而降,倾斜撞向了尚未完全长成的"雏形"地球。剧烈的撞击迅速粉碎和融化了整个撞击体,也把地球的一部分物质撞了出来。这些碎屑物质散落在地球四周,又通过碰撞和吸积最终形成了如今的月球。

(图:大撞击假说的假想图。 来源:museumvictoria.com.au)


这就是著名的大撞击假说(Giant Impact Hypothesis)为我们构建的月球起源图景(Hartmann and Davis, Icarus, 1975; Canup and Asphaug, Nature, 2001),科学家们还给这颗假想中的撞击体赋予了一个意味深长的名字——忒亚(Theia),她是希腊神话中的泰坦女神,也是月神塞勒涅(Selene)之母。


修修补补几十年——行星科学家:宝宝心里苦!

虽然人们对月球的起源一直有诸多猜想,但大撞击假说是近几十年来最受青睐的一个,因为它能较好地解释如今地球的自转倾角、地月系统的密度差异和轨道动力学关系。


但物理上的大厦盖起来了,化学上的窟窿怎么办?行星科学家们可以说是绞尽脑汁。

起初,人们想当然地认为撞击产生的碎屑一定是大部分来自忒亚,小部分来自地球,那么最终形成的月球在化学成分上(比如某种元素的各种同位素比例)应该更接近忒亚而非地球对吧。

可是阿波罗任务带回来的月球岩石的同位素含量测量显示,地月岩石以氧为首的一些同位素的比例像得不得了,几乎没有差异啊 (Wiechert et al., Science, 2001)。

月球岩石的δ17O和δ18O的比例和地球岩石的非常一致,几乎不可区分,而他们和火星岩石就非常不同。来源:Pahlevan and Stevenson (EPSL, 2007)


坏了,那怎么办?简单,让忒亚和地球的化学成分相同不就行了么,反正45亿年前的忒亚是啥样还不是靠推(瞎)理(猜)么!

可是显然忒亚和地球的化学成分不同才是更有可能的情况,毕竟两个素未谋面的天体化学成分上一毛一样,这概率实在有点小。为了让大撞击假说更有说服力,行星地球化学家们又提出了"同位素均一理论(isotopic equilibration)",认为在当时大撞击之后,地球外层物质和忒亚的碎屑在一个高温熔融气化的环境中充分混合了,所以两者的成分表现出了高度相似性(Pahlevan and Stevenson, EPSL, 2007)。

问题又来了,氧这样的易挥发元素好说,但地月的钛和钨这样的难熔元素的同位素含量也非常相似 (Zhang et al., 2012; Dauphas et al., 2014),这就解释不通了,因为这些元素非常耐高温,不太可能熔融气化参与这种充分混合啊。


好说,咱们把原本的动力学模型再改改。

比如,如果最初的撞击更剧烈,撞出更多更深的地球物质,让最终生成的月球主要由地球的幔层物质组成而非忒亚不就结了。但更剧烈的撞击会让之后的地月系统角动量比现在大不少啊,这对不上。怎么办?让它在地月系统和太阳的轨道共振中消耗掉呗——这就是"高能撞击模型"(Ćuk and Stewart, Science, 2012; Canup, Science, 2012)。

或者干脆不要撞一次了,如果是小一点的忒亚(们),多次撞击了雏形地球,这些撞击产生的碎屑更容易充分混合和自由迁移,也可能产生目前的地月化学成分——这就是"多次撞击假说"(Rufu et al., 2017; Lock and Stewart, JGR, 2017)。


可还是不对,就算大撞击结束之后的地月岩石的化学成分可以达到一致,可那毕竟是45亿年前啊!在那之后的漫长年月里,地球和月球依然经历了多次小行星和彗星的撞击,这些撞击必然为地月系统带来了新的物质——这被称为"后增薄层(late veneer)"(Walker et al., 2015)。新旧物质的混合会进一步改变地球和月球的化学成分,也就是说,即使45亿年前的地月化学成分是一样的,到现在也不应该一样了……


这还没完,虽然诸多研究者们已经翻来覆去测过n多次了,但不同的研究者用不同的样品测的结果还不一样……有研究就表明:我们测的地球和月球的氧同位素含量明明差别很大啊(月球和氧同位素含量有高达12 ppm的差别,1 ppm=百万分之一,而支持"几乎没有差别"的研究认为只有不到1ppm的差别)!我这儿和大撞击理论符合得好着呢,你们前面那些都想多了,洗洗睡吧 (Herwartz et al., Science, 2014)!当然,之前之后的众多行星地球化学家们都强烈反对这个实验结果 (Young et al., Science, 2016)……


其实,以上这些不过是近二三十年来月球起源假说各种争论的冰山一角……在大撞击假说这栋大厦里,行星科学家们就这样补完一楼补二楼,补完二楼补三楼,补完三楼……什么?一楼又破了?!

行星科学家们:宝宝心里苦,难过到嗦不出话……


不过,聪明的大家一定发现了,说来说去,有一个基本的争议点决定了后面所有假(脑)说(洞)的走向:

地球和月球的氧同位素含量到底是不是差不多啊?!这个问题实在是太关键了。


重测氧同位素含量,重现地球的含水量变化

近日,英国开放大学的Greenwood及其同事们又㕛叒叕测了一把地球和月球的氧同位素含量。他们的实验中使用了高精度的同位素测量方法,囊括了目前为止最全面的月球和地球岩石样本。结果显示:月球岩石和地球玄武岩的氧同位素含量存在3-4 ppm(也就是百万分之三到四)的差别,这个差别在统计上显著可区分。也就是说,差别是存在的,但很小——比12 ppm小得多,但也不止1 ppm那么小。

月球岩石的δ17O比例平均值比地球岩石大3-4 ppm,显著可区分,注意这张图为了让两者的差异显著,对δ17O比例取值做了一定处理,所以线是平的而不是斜的。来源:Greenwood et al. (Science Advance, 2018)


什么意思呢?就是说,之前关于大撞击假说的那些补丁依然有必要打,而且,还不够。

不够的地方在于,仅仅是撞击之后的混合,似乎并不足以导致4 ppm的差别……

Greenwood及其同事们又以顽火无球粒陨石(aubrites)代表忒亚的化学成分,模拟了撞击之后氧同位素的混合和含量。顽火无球粒陨石富镁、贫铁,且的氧同位素含量和月球岩石相近,因而被认为化学成分很接近当年的撞击物。模拟结果显示,撞击和混合之后月球和地球岩石的氧同位素含量差异应当只有2 ppm。也就是说,原本撞击和混合之后也会有一点点差别,但这个一点点还是比岩石样本中测得的一点点小不少:地月岩石的氧同位素差异只有一半是原本的大撞击和混合造成的,而另一半是怎么来的呢?是之后的小行星和彗星撞击引起的,也就是上一节所说的"后增薄层"的影响了。

(图:后增薄层对地球化学成分的后期改造。改编自:Kleine (Nature, 2011))

在大撞击之后的45亿年里,无数小行星和彗星来到了地球,过去的研究认为,正是这些小行星和彗星,给地球带来了大部分水和挥发物,而这些新加入的氧元素,也改变了地球岩石的氧同位素比例。然而,Greenwood及其同事们通过这次的地月岩石氧同位素含量的测量值进行推算,却发现地球全球水量中只有5-30%是大撞击之后地球上新增的,也就是说,地球上绝大部分的水可能在45亿年前的那次大撞击之前,就已经静静地存在于雏形地球上了。

不过这个结论也不是首次提出了,Fischer-Gödde and Kleine (Nature, 2017) 也通过对比地球和各种球粒陨石中钌同位素异常,提出后增薄层并不是地球上水和挥发物的主要来源,也就是说两者虽然用了不同的方法,但得到了一致的结论。

那么这些水是如何在还未长成的地球上诞生,如何在大撞击和频繁的小型撞击之下幸存的?这些还有待行星科学家们继续探索。另一方面,如果在行星形成早期的极端环境下就能有如此大量的水存在,那么经历过相似阶段的系外行星上有液态水和适宜生命存在环境的希望似乎也大了不少。

至于大撞击假说这栋大厦将来会怎么样嘛……或许有一天,行星科学家们能把所有的补丁都给完美补上,也或许有一天,补丁打太多大厦直接就塌了……谁知道呢?



致谢本文感谢好友Yanhao Lin, Shaofan Che, Le Qiao, Boyang Liu的审稿和对本文内容提升所提供的帮助。


老规矩,简易阅读版发在公众号haibaraemily_planets。


BTW,这还是哀酱第一次听说有开放大学(Open University)这么个大学……是一所公立的远程教育大学,大部分学生都是远程学习……可以授予本科和硕士学位,有校园,有工作和研究人员……




参考文献

  • , R. C., Barrat, J. A., Miller, M. F., Anand, M., Dauphas, N., Franchi, I. A., ... & Starkey, N. A. (2018). Oxygen isotopic evidence for accretion of Earth's water before a high-energy Moon-forming giant impact. Science advances, 4(3), eaao5928.
  • Hartmann, W. K., & Davis, D. R. (1975). Satellite-sized planetesimals and lunar origin. Icarus, 24(4), 504-515.
  • Wiechert, U., Halliday, A. N., Lee, D. C., Snyder, G. A., Taylor, L. A., & Rumble, D. (2001). Oxygen isotopes and the Moon-forming giant impact. Science, 294(5541), 345-348.
  • Pahlevan, K., & Stevenson, D. J. (2007). Equilibration in the aftermath of the lunar-forming giant impact. Earth and Planetary Science Letters, 262(3-4), 438-449.
  • Zhang, J., Dauphas, N., Davis, A. M., Leya, I., & Fedkin, A. (2012). The proto-Earth as a significant source of lunar material. Nature Geoscience, 5(4), 251.
  • Dauphas, N., Burkhardt, C., Warren, P. H., & Fang-Zhen, T. (2014). Geochemical arguments for an Earth-like Moon-forming impactor. Phil. Trans. R. Soc. A, 372(2024), 20130244.
  • Ćuk, M., & Stewart, S. T. (2012). Making the Moon from a fast-spinning Earth: a giant impact followed by resonant despinning. science, 338(6110), 1047-1052.
  • Canup, R. M. (2012). Forming a Moon with an Earth-like composition via a giant impact. Science, 1226073.
  • Lock, S. J., & Stewart, S. T. (2017). The structure of terrestrial bodies: Impact heating, corotation limits, and synestias. Journal of Geophysical Research: Planets, 122(5), 950-982.
  • Rufu, R., Aharonson, O., & Perets, H. B. (2017). A multiple-impact origin for the Moon. Nature Geoscience, 10(2), 89.
  • Walker, R. J., Bermingham, K., Liu, J., Puchtel, I. S., Touboul, M., & Worsham, E. A. (2015). In search of late-stage planetary building blocks. Chemical Geology, 411, 125-142.
  • Herwartz, D., Pack, A., Friedrichs, B., & Bischoff, A. (2014). Identification of the giant impactor Theia in lunar rocks. Science, 344(6188), 1146-1150.
  • Young, E. D., Kohl, I. E., Warren, P. H., Rubie, D. C., Jacobson, S. A., & Morbidelli, A. (2016). Oxygen isotopic evidence for vigorous mixing during the Moon-forming giant impact. Science, 351(6272), 493-496.
  • Kleine, T. (2011). Geoscience: Earth's patchy late veneer. Nature, 477(7363), 168.
  • psi.edu/epo/moon/moon.h
  • Fischer-Gödde, M., & Kleine, T. (2017). Ruthenium isotopic evidence for an inner Solar System origin of the late veneer. Nature, 541(7638), 525.


来源:知乎 www.zhihu.com
作者:haibaraemily

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。 点击下载