内生社会效应的识别:反射问题

内生社会效应的识别:反射问题
摘要. 本文探讨了当研究人员观察一个群体的行为分布,试图推断某个群体的平均行为是否影响了构成该群体的个体的行为时所产生的反思问题。研究发现,除非研究人员事先掌握了具体说明参照群体构成的信息,否则推断是不可能的。如果有了这些信息,推论的前景主要取决于界定参照群体的变量与直接影响结果的变量之间的总体关系。如果这些变量在函数上相互依赖或在统计上相互独立,那么推论就很难进行。如果界定参照组的变量与直接影响结果的变量在人群中的关系适中,则推断的前景较好。
1. 引言 各种常用术语都意味着内生的社会效应,即一个人以某种方式行事的倾向随着该行为在包含该人的某个参照群体中的流行程度而变化。根据语境的不同,这些效应可被称为 “社会规范”、”同伴影响”、”邻里效应”、”顺应”、”模仿”、”传染”、”流行病”、”浪潮”、”从众行为”、”社会互动 “或 “相互依存的偏好”。 长期以来,内生效应一直是社会学和社会心理学的核心;例如,参见 Asch (1952)、Merton (1957)、Erbring 和 Young (1979) 以及 Bandura (1986)。主流经济学一直从根本上关注一种特殊的内生效应:个人对产品的需求如何随价格变化,而价格部分由相关市场的总需求决定。经济学家也研究过其他类型的内生效应。寡头垄断模型提出了反应函数,即每个企业选择的产出是行业总产出的函数。Schelling(1971 年)分析了当个人选择不居住在同种族居民比例低于某个临界值的社区时出现的居住模式。Conlisk (1980) 的研究表明,如果决策成本高昂,那么个人模仿其他知情者的行为可能是最优选择。阿克洛夫(1980 年)、琼斯(1984 年)和伯恩海姆(1991 年)研究了个人因偏离群体规范而受到惩罚的非合作博弈的均衡状态。Gaertner (1974)、Pollak (1976)、Alessie 和 Kapteyn (1991) 以及 Case (1991) 分析了消费者需求模型,在这些模型中,在价格固定的情况下,个人需求会随着参照群体平均需求的增加而增加。 虽然总需求以价格为中介对个人需求产生的影响已被普遍接受,但其他内生性影响却存在争议。许多经济学家认为这些社会学的核心概念,如规范和同伴影响,都是虚假的现象,完全可以用个人层面的运作过程来解释。(例如,参见弗里德曼(Friedman,1957 年)对杜森伯里(Duesenberry,1949 年)的批评)。即使在社会学家中,人们对社会效应的性质也没有达成共识。例如,关于邻里效应的存在和性质的争论由来已久。(例如,参见 Jencks and Mayer (1989)) 为什么仍然存在这种不同的观点?为什么社会科学似乎无法就社会影响个人的渠道达成共同结论?我认为,答案的很大一部分是识别问题的困难。对行为的经验分析往往无法区分关于社会影响性质的各种相互竞争的假设。 长期以来,经济学家一直关注如何识别通过市场产生的内生效应,特别是在什么条件下,对均衡价格和数量的观察可以揭示消费者的需求行为和企业的供给行为。但是,对其他内生效应的识别相对而言仍未进行研究,人们对其的理解也不甚透彻。 本文研究的是 “反射 “问题,当研究者观察一个群体的行为分布,试图推断某个群体的平均行为是否会影响组成该群体的个体的行为时,就会出现这个问题。用 “反射 “一词是恰当的,因为这个问题类似于解释一个人和他在镜子中的倒影几乎同时发生的运动。是镜像导致了人的动作,还是镜像反映了人的动作?不了解光学和人类行为的观察者是无法分辨的。 尽管反思问题涉及多个方面,但本文所报告的一系列简单结论都是对反思问题的综合阐 述:除非研究人员事先掌握参照群体构成的具体信息,否则无法推断内生效应。如果有了这些信息,推论的前景就主要取决于界定参照群体的变量与直接影响结果的变量之间的人口关系。如果这些变量在功能上相互依赖或在统计上相互独立,那么推论就很难进行。如果界定参照组的变量与直接影响结果的变量在人群中 “适度 “相关,则推断的前景较好。 第 2 节探讨了在许多社会效应实证研究中应用的线性模型背景下的反映问题。第 3 节分析非线性模型。第 4 节讨论动态模型。第 5 节将传统的消费者需求分析与本文的工作联系起来。第 6 节最后强调,如果要在社会效应分析方面取得更大进展,就需要更丰富的数据。 2. 一个线性模型 这里分析的线性模型正式表达了三个假说,这三个假说经常被用来解释属于同一群体的个体往往行为相似这一常见现象。这些假设是:
  1. [a] 内生效应,即个人行为倾向随群体行为的变化而变化;
  2. [b] 外生(背景)效应,即个人行为倾向随群体的外生特征的变化而变化,[1] 以及
  3. 相关效应,即同一群体中的个体由于具有相似的个体特征或面临相似的制度环境而倾向于做出相似的行为。
举例说明可能有助于澄清区别。请看一个十几岁青年的高中成绩。如果在其他条件相同的情况下,个人成绩趋向于随青少年所在学校、种族群体或其他参照群体学生的平均成绩而变化,则存在内生效应。如果成绩随参照群体的社会经济构成等因素的变化而变化,则存在外生效应。如果同一所学校的青少年因家庭背景相似或由相同的教师授课而成绩相近,则存在相关效应。 这三个假设具有不同的政策含义。例如,考虑一项教育干预措施,为学校的部分学生提供辅导,但不为其他学生提供辅导。如果个人成绩随着学校学生平均成绩的提高而提高,那么一个有效的辅导计划不仅直接帮助了接受辅导的学生,而且随着他们成绩的提高,间接帮助了学校的所有学生,并反馈给接受辅导的学生进一步提高成绩。外生效应和相关效应不会产生这种 “社会乘数”。 第 2.1 节具体说明了模型。第 2.2 和 2.3 节分析了识别问题,首先考虑了一般模型,然后是假定既不存在外生效应也不存在相关效应的限制版本。第 2.4 节表明,尽管线性模型有时会对观察到的行为施加限制,但如果定义参照组的属性和直接影响结果的属性在功能上是相互依赖的,则该模型同义成立。第 2.5 节说明了识别参照组问题的意义。第 2.6 节讨论样本推断。 2.1. 模型识别 令总体的每一个成员可以通过$(y,x,z,u)\in R^1\times R^J\times R^K\times R^1$的值来表征。这里 y 是一个标量结果(如青少年的高中成绩),x 是表征个体参照群体的属性(如青少年的学校或种族群体),(z, u) 是直接影响 y 的属性(如社会经济地位和能力)。研究人员观察 (y、x、z) 实现的随机样本。不观察 u 的实现情况。 假设 \begin{equation}\label{eq:1} y=\alpha+\beta E(y \mid x)+E(z \mid x)^{\prime} \gamma+z^{\prime} \eta+u,\quad E(u \mid x, z)=x^{\prime} \delta \end{equation} 其中$(\alpha,\beta,\gamma,\delta,\eta)$是参数向量。由此可见,y 对(x,z)的均值回归具有线性形式 \begin{equation}\label{eq:2} E(y \mid x, z)=\alpha+\beta E(y \mid x)+E(z \mid x)^{\prime} \gamma+x^{\prime} \delta+z^{\prime} \eta \end{equation} 如果$\beta\neq 0$,线性回归\eqref{eq:2}表示一个内生效应:一个人的结果 y 随$E(y|x)$的变化而变化,$E(y|x)$是由 x 定义的参照组中 y 的平均值。[2] 如果$\gamma\neq 0$,模型表达的是一种外生效应:y 随 $E(z|x)$变化,即外生变量 z 在参照组中的平均值。如果$\delta \neq 0$,模型表达的是相关效应:参照组 x 中的人倾向于采取类似的行为。因为他们具有相似的未观察到的个人特征 u 或面临相似的制度环境。参数$\eta$表示 z 对 y 的直接影响。 \footnote{模型(2)的许多概括可能会引起人们的兴趣。非线性模型和动态模型将在第 3 节和第 4 节中探讨。其他一些推广方向包括以下内容:
  1. [i] 每个人都可能受到多个参照群体的影响。
  2. [ii] 结果 y 可能是一个矢量,产生一个内生效应系统,每个维度的参照群体平均结果会影响其他维度的个人结果。
  3. [iii] 社会效应可能通过平均值以外的分布特征传递。例如,有时人们会说,社会规范对个人行为影响的强弱取决于参照群体行为的分散程度;分散程度越小,规范越强。
} 2.2. 参数识别 问题是这两类社会效应是否可以相互区分,是否可以与非社会效应区分开来。因此,我们感兴趣的是参数$\alpha, \beta,\gamma,\delta,\eta$的识别。为了把注意力集中在这个问题上,我将假设 (i) (x, z) 具有离散的支持,或者 (ii) y 和 z 具有有限方差,并且回归 $[E(y \mid x, z), E(y \mid x), E(z \mid x)]$在 (x, z) 的支持上是连续的。无论哪种假设都意味着$[E(y \mid x, z), E(y \mid x), E(z \mid x)]$在$(x,z)$的支持上是连续可估计的。 [3] 因此,我们可以将这些回归结果视为已知结果,重点关注参数。 反射问题是由于$E(y|x)$作为回归变量出现在\eqref{eq:2}中。将(2)两边相对于 z 进行积分,可以发现$E(y|x)$解决了 “社会均衡 “方程 \begin{equation}\label{eq:3} E(y \mid x)=\alpha+\beta E(y \mid x)+E(z \mid x)^{\prime} \gamma+x^{\prime} \delta+E(z \mid x)^{\prime} \eta . \end{equation} 只要$\beta\neq 1$,方程 (3) 就有唯一的解,即 \begin{equation}\label{eq:4} E(y \mid x)=\alpha /(1-\beta)+E(z \mid x)^{\prime}(\gamma+\eta) /(1-\beta)+x^{\prime} \delta /(1-\beta) . \end{equation} 因此,$E(y|x)$是$[1,E(z|x),x]$的线性函数,其中 “1 “表示常数。由此可见,参数$(\alpha,\beta,\gamma,\delta)$都是未确定的。内生效应无法与外生效应或相关效应区分开来。 确定了什么?将 (4) 插入 (2),我们得到简化模型 \begin{equation} E(y \mid x, z)=\alpha /(1-\beta)+E(z \mid x)^{\prime}[(\gamma+\beta \eta) /(1-\beta)]+x^{\prime} \delta /(1-\beta)+z^{\prime} \eta \end{equation}
命题 1. 在$\beta\neq 1$的线性模型(2)中,如果回归数[1,E(z|x),x,z]在总体中是线性独立的,那么综合参数$\alpha/(1-\beta),(\gamma+\beta\eta)/(1-\beta),\delta/(1-\beta)$和$\eta$就可以确定。
[4] 复合参数的确定并不能区分两种社会效应,但可以确定是否存在某种社会效应。如果$(\gamma+\beta\eta)/(1-\beta)$不为零,那么$\beta\eta$或$\gamma$一定不为零。 如果$E(z|x)$是$[1,x,z]$的线性函数,那么检测某种社会效应的能力就会崩溃。不幸的是,$E(z|x)$在各种情况下都是$[1,x,z]$的线性函数,包括命题 1 的以下推论中所述的情况。
推论 2. 在$\beta\neq 1$的线性模型中,如果这些条件中的任何一个成立,则几乎所有地方的综合社会效应参数$(\gamma+\beta\eta)/(1-\beta)$都不会被识别。
  1. [(a)] $z$是$x$的函数。
  2. [(b)] $E(z|x)$不随着$x$变化。
  3. [(c)] $E(z|x)$是$x$的线性函数。
推论表明,推断社会效应是否存在的能力主要取决于 z 随 x 变化的方式。在线性模型(2)中,只有当 $E(z|x)$随 x 非线性变化且$Var(z|x)>0$时,才能推断出是否存在社会效应。 2.3. 一个纯内生效应模型 如果我们掌握了某些参数值的信息,那么识别的前景就会有所改善。对内生效应的实证研究通常假定$\gamma=\delta=0$;因此既不存在外生效应,也不存在相关效应。在这种情况下,(5) 简化为 \begin{equation}\label{eq:6} E(y \mid x, z)=\alpha /(1-\beta)+E(z \mid x)^{\prime}[\beta \eta /(1-\beta)]+z^{\prime} \eta . \end{equation} 对 (6) 的检查结果如下:
命题 3. 在参数限制为$\gamma=\delta=0$和$\beta\neq1$的线性模型\eqref{eq:2}中,如果回归因子$[1,E(z|x),z]$在群体中是线性独立的,则综合参数$\alpha/(1-\beta),\beta\eta/(1-\beta)$和$\eta$被识别出来。 如果$\eta=0$或$E(z|x)$是$[1,z]$的线性函数,则无法识别内生效应参数$\beta$。特别是,如果这些条件中的任何一个成立,几乎所有地方都无法识别$\beta$:
  1. [(a)] $z$是$x$的函数。
  2. [(b)] $E(z|x)$并不随着$x$变化。
  3. [(c)] $E(z|x)$是$x$的线性函数。$x$是$z$的线性函数。
例如,在一项关于学校成绩的研究中,如果 x 是家庭收入,z 是能力,平均能力 E (z Ix) 随收入非线性变化,而成绩随能力变化(即. $\eta\neq 0$),则$\beta$是确定的。但是,如果 x 是(能力,家庭收入),z 是能力(条件 a);x 是家庭收入,z 是能力,而平均能力不随收入变化(条件 b);或者 x 是家庭收入,z 是(能力,家庭收入),而平均能力随收入线性变化(条件 d),则无法识别$\beta$。 2.4. 同义反复模型 即使其参数不确定,社会效应模型也可能对观察到的行为施加限制,从而产生可检验的影响。然而,有一些(x,z)的规格会使模型同义成立。特别是当 x 和 z 是函数依赖关系时。 指定 z 是 x 的函数,比如 z=z(x)。那么,$E[y|x,z(x)]=E(y|x)$。因此,线性模型 (2) 在$\beta=1$和$\alpha=\gamma=\delta=\eta=0$的条件下成立。因此,观察到的行为总是与个人行为反映参照群体平均行为的假设相一致。例如,如果研究学生成绩的研究人员将 x 定义为(能力、家庭收入),z 定义为(能力),那么他就会发现数据符合以下假设:参照群体由(能力、家庭收入)定义,个人成绩反映参照群体的成绩,能力对成绩没有直接影响。 反之,指定 x 为 z 的函数,即 x = x(z)。那么 $E[y |x(z), z] = E(y |z)$。因此,半线性模型 \begin{equation}\label{eq:2′} E(y \mid x, z)=\alpha+\beta E(y \mid x)+E(z \mid x)^{\prime} \gamma+x^{\prime} \delta+g(z) \end{equation} 在$\alpha=\gamma=\delta=\eta=0$和 g( z) = E (y |z) 的条件下成立;线性模型 (2) 的唯一可检验限制是其假设 g( .) 是线性函数。继续以学业成绩为例,如果研究者将 x 设为(家庭收入),z 设为(能力、家庭收入),就会发现 数据与社会力量不影响学业成绩的假设是一致的。 2.5. 识别参照群组 到目前为止,我一直假定研究人员知道个人是如何形成参照群体的,而且个人能够正确理解其假定参照群体所经历的平均结果。我们有充分的理由质疑这些假设。研究社会效应的学者很少提供经验证据来支持他们的参照群体规范。普遍的做法是简单地假定,对于某些特定的 x,个人会受到 E(ylx) 和 E(zlx) 的影响。 [5] Woittiez 和 Kapteyn(1991)是为数不多的试图证明其参照群体规格的研究之一。他们将个人对有关其 “社会环境 “问题的回答作为其参照群体的证据。 如果研究人员不知道个人如何形成参照群体以及如何看待参照群体的结果,那么就有理由问,观察到的行为是否可以用来推断这些未知因素。第 2.4 节中报告的研究结果表明这是不可能的。任何功能依赖对(x,z)的说明都与观察到的行为一致。由此得出的结论是,对参照组进行知情说明是分析社会效应的必要前奏。 2.6. 样本推断 尽管我们主要关注的是识别问题,但仍有必要对样本推断进行讨论。 对社会效应的实证研究一般假定不存在相关效应,而且只有两种社会效应中的一种。关于外生效应的研究通常采用两阶段法来估计$(\gamma,\eta)$。在第一阶段,利用$(z,x)$的样本数据对$E(z|x)$进行非参数估计;通常$x$是离散的,$E(z|x)$的估计值是单元平均值。在第二阶段,通过寻找 y 与 $[1, E_N(z|x), z]$ 的最小二乘拟合来估计$(\gamma,\eta)$,其中 $E_N(z |x)$ 是 $E(z|x)$ 的第一阶段估计值。参见 Coleman 等人 (1966)、Sewell 和 Armer (1966)、Hauser (1970)、Crane (1991) 或 Mayer (1991)。 对内生效应的研究也采用了两阶段法来估算$\beta,\eta$,但采用的是 “空间相关”模型: \begin{equation}\label{eq:7} y_i=\beta W_{i N} Y+z_i^{\prime} \eta+u_i, \quad i=1, \cdots, N \end{equation} 这里$Y=\left(y_i, i=1, \cdots, N\right)$是$y$的$N\times 1$样本实现向量,$W_{iN}$是指定的$1\times N$加权向量;$W_{iN}$的分量为非负,且和为 1。扰动$u$通常假定为正态分布,与 x 无关,模型用最大似然法估计。参见 Cliff and Ord (1981)、Doreian (1981) 或 Case (1991)。 等式(7)指出,样本中每个人的行为会随着其他样本成员行为的加权平均值而变化。因此,空间相关模型假定内生效应存在于研究者的样本中,而不是样本所来自的总体中。这在小群体互动研究中是合理的,因为在小群体互动研究中,样本是由朋友、同事或家庭成员组成的;例如,参见 Duncan、Haller 和 Portes(1968 年)或 Erbring 和 Young(1979 年)。但是,在邻里关系和其他大群体社会效应的研究中,样本成员是随机选择的个人,这就说不通了。从表面价值来看,公式(7)意味着样本成员知道彼此是谁,并且只有在被选入样本后才会选择他们的结果。 如果将空间相关模型解释为一种估算纯内生效应模型的两阶段方法,那么它在大群体互 动研究中确实是有意义的。在第一阶段,我们使用(y,x)的样本数据对$E(y|x)$进行非参数估计;在第二阶段,我们通过寻找 Y 与 $[1,E_N(y|x),z]$ 的最小二乘拟合来估计$(\beta,\eta)$,其中$E_N(y|x)$是$E(y|x)$的第一阶段估计值。$E(y|x_i)$ 的许多非参数估计值是$E_N(y|x_i)=W_{iN}Y$形式的加权平均值,其中$W_{iN}$决定具体的估计值;见 Hardie (1990)。因此,空间相关文献中报告的$(\beta,\eta)$估计值可以解释为纯内生效应模型的估计值。 请注意,点估计可以用于未识别的模型。如果命题 2 的条件 a、b 或 d 成立,则 E(y |x) 是 [1, z] 的线性函数。但估计值 $E_N(y|x)$通常与[1,Z]线性无关。因此,两阶段程序通常能得出$\beta$的估计值,即使该参数尚未确定。 \footnote{有必要指出的是,报告社会效应模型两阶段估计值的实证研究经常错误地报告其估计值的抽样分布。外生效应模型两阶段估计的做法是将第一阶段估计值$E_N(z|x)$当作$E(z|x)$而不是其估计值。关于空间相关模型的文献假定等式\eqref{eq:7}成立,并没有具体说明权重$W_{iN}$应如何随$N$变化。 社会效应模型的两阶段估计类似于其他半参数两阶段估计问题,最近对其渐近性质进行了研究。Ahn 和 Manski(1993)、Ichimura 和 Lee(1991)等人分析了各种估计器的渐近行为,这些估计器的第一阶段是非参数回归,第二阶段是以第一阶段估计为条件的参数估计。研究通常发现,如果第一阶段估计器选择得当,则识别参数的第二阶段估计与极限正态分布一致。极限分布的方差通常大于已知第一阶段回归而非估计时的方差。看来这一结果在这里也有可能成立。} 3. 非线性内生效应模型 当社会效应模型不一定是线性模型时,第 2 节中报告的研究结果如何?本节将探讨两种情况。第 3.1 节假定某人不知道回归的形式,因此对社会效应进行了非参数分析。第 3.2 节假定回归是指定的非线性函数族的成员。为了使分析相对简单,我将注意力限制在纯内生效应模型上。 3.1. 非参数分析 假设对于一些位置函数$f:\;R^1\times R^K{\to}R^1$, \begin{equation}\label{eq:8} E(y|x,z)=f(E(y|x),z) \end{equation} 这种非参数内生效应模型,隐含的社会均衡方程为: \begin{equation}\label{eq:9} E(y|x)=\int f[E(y|x),z]dP(z|x), \end{equation} 放弃低2.3节中的线性假设。 在这种非参数环境下,我们可以直接测量内生效应,而不是通过参数来测量。也就是说,我们先固定 z,然后询问$f[E(y|x),z]$如何随$E(y|x)$变化。让$\xi\in E^K$和$(e_0,e_1)\in R^2$。那么对比 \begin{equation}\label{eq:10} T(e_1,e_0,\xi)\equiv f(e_1,\xi)-f(e_0,\xi) \end{equation} 衡量的是外生改变参照组平均行为(从$e_0$到$e_1$)在$\xi$处的影响。在没有函数形式假设的情况下,$f(\cdot,\cdot)$在$[E(y|x), z]$的支持上被识别。当且仅当$(e_1,\xi)$和$(e_0,\xi)$都在 $[E(y|x),z]$的支持上时,对比$T(e_1,e_0,\xi)$才被识别。 要想说得更多,就必须确定$[E(y|x),z]$的支持特征。确保对比被识别的有用条件似乎很难获得。另一方面,我可以证明,如果 x 和 z 在函数上相互依赖或在统计上相互独立,对比一般不会被识别。
命题 4. 在非参数内生效应模型\eqref{eq:8}中,如果这些条件中的任何一个成立,几乎在所有地方都不会出现\eqref{eq:10}形式的对比:
  1. [(e)] $z$是$x$的函数,社会均衡方程\eqref{eq:9}有唯一的解。
  2. [(f)] $z$在统计上与$x$无关,社会均衡方程\eqref{eq:9}有唯一的解。
  3. [(g)] $x$是$z$的函数。
证明 . 如果$E (y |x)$是 z 的函数,则$(e_1,\xi)$和$(e_0,\xi)$不可能都在$(x,z)$的支持面上。因此无法识别对比。条件 e、f 和 g 都意味着 E(y|x) 是 z 的函数。
  1. [(e)] 令$\xi\in R^K$。以事件$[z=\xi]$为条件的 x 的分布集中在集合$X(\xi)\equiv[x:z(x)=\xi]$上;因此,以事件$[z=\xi]$为条件的 E(y |x) 的分布集中在 $[E(y|x), X\in X(\xi)]$ 上。对于 $X\in X(\xi)$,$p(z|x)$ 的所有质量都在点$\xi$上。因此,对于$x\in X(\xi)$方程\eqref{eq:9}简化为 $E (y |x) =f[E (y |x],\xi]$ 。因此,对于$X(\xi)$中的每个 x,E (y |x) 都求解了同一个方程。因此,E (y |x) 几乎在任何地方都是 z 的函数。
  2. [(f)] 统计独立性意味着 p(z|x) = P(z)。因此,\eqref{eq:9}简化为 $E(y|x) =\int f[E(ylx),z]dP(z)$ 。因此,E(y|x) 对每个 x 值都求解同一个方程。
  3. [(g)] 设 $x\equiv x(z)$。那么 E[y|x(z)] 是 z 的函数。
思考这个命题的一个有用方法是想象 $f( . , . ) $与 $\beta\neq 1$,但是,由于不知道这一点,我们只能进行非参数分析。线性模型具有唯一的社会均衡,因此条件 e、f 和 g 都适用。综上所述,如果定义参照组的属性和直接影响结果的属性在功能上相互依赖或在统计上相互独立,那么这些条件就会排除对内生效应的非参数识别。只有当 x 和 z 是 “适度相关 “的随机变量时,才有可能对社会效应进行非参数研究。 如果$f(\cdot,\cdot)$不是非线性的,能产生多个社会均衡,那么识别的前景可能会更好。在这种情况下,条件 g 仍然有效,但 e 和 f 不适用。当存在多个均衡时,$E(y|x)$可能会从一个均衡值波动到另一个均衡值,因此可能不是 z 的函数。 3.2. 二元响应模型 人们最熟悉的具有内生效应的非线性参数模型可能是二元响应模型。让 y 成为二元随机变量,并假设 \begin{equation}\label{eq:11} P(y=1|x,z)=H[\alpha+{\beta}P(y=1|x)+z’\eta], \end{equation} 其中 $H (\cdot)$是一个指定的连续、严格递增的分布函数。例如,如果$H (\cdot)$是 logistic 分布,我们就得到了一个具有社会效应的 logit 模型。 形式\eqref{eq:11}的模型是通过两阶段方法估计的。通常的方法是非参数估计 P(y = 1|x),然后通过最大化$ P_N(y = 1|x)$代替 $P(y = 1| x)$的准概率来估计$(\beta,\gamma)$。这方面的例子包括 Case 和 Katz (1991) 以及 Gamoran 和 Mare (1989)。Manski 和 Wise(1983 年,第 6 章)用这种方法估算了一个多项式反应模型。 文献没有涉及模型\eqref{eq:11}的一致性和识别问题,但我可以在此解决一致性问题。如果社会均衡方程有一个解,那么模型就是连贯的 \begin{equation}\label{eq:12} P(y=1|x)=\int H[\alpha+\beta{}P(y=1|x)+z’\eta]dP(z|x). \end{equation} 如果$\beta=0$, $E(y|x)=\int H(\alpha+z’\eta)dP(z|x)$ 所以\eqref{eq:12} 有唯一的解。如果 $\beta<0$ ,当$ E(y|x)$ 从 0 上升到 1 时,\eqref{eq:12}的右边会从$\int H(a + z'\eta )dP(z |x) $严格连续递减到 $JH(\alpha+\beta+z'\eta)dP(z|x)$ 。因此,左右两边在 $E(y|x)$ 的唯一值处交叉。 最后,让$\beta>0$。在这种情况下,存在一个解,因为当 E (y |x) 从 0 上升到 1 时,\eqref{eq:12} 的右边会从$\int H(a + z’\eta)dP(z|x)$ 严格连续地增加到$\int H(\alpha+\beta+ z’\eta)dP(z |x)$。与此同时,左侧边穿过更大的区间 [0,1]。因此,在 E(y|x) 的某个值处,左侧边必须从下往上穿过右侧边。 以上说明,具有内生效应的二元响应模型总是一致的。当$\beta\leq 0$时,这些模型具有唯一的社会均衡。当$\beta>0$时,似乎不可能在不施加额外结构的情况下确定平衡点的数量。确定参数$(\alpha,\beta,\eta)$的条件尚未确定。 4. 动态模型 迄今为止提出的模型假定了同期效应。假设这些效应的传递存在一定的滞后性可能更为现实。一些学者,包括 Alessie 和 Kapteyn(1991 年)以及 Borjas(1991 年),对线性模型\eqref{eq:2}进行了如下动态估算: \begin{equation}\label{eq:13} E_t(y|x,z)+\alpha+\beta E_{t-1}(y|x)+E_{t-1}(z|x)’\gamma +x_t’\delta +z_t’\eta, \end{equation} 其中,$E$, 和$E_{t-1}$ 分别表示第 t 期和第 t – 1 期的期望值。我们的想法是,非社会力量是同时作用的,但社会力量对个人的作用是滞后的。 如果$\{E(z|x), x, z\}$是时间不变的,且$-1 <\beta < 1$,则动态过程\eqref{eq:13}具有形式为\eqref{eq:3}的唯一稳定的时间均衡。如果观察到该过程处于时间均衡状态,则第 2 节的识别分析无需修改即可成立。另一方面,如果观察到的是非均衡过程,\eqref{eq:13}的递归结构为识别提供了新的可能性。 但是,我们不能因此就认为动态模型解决了确定社会效应的问题。要利用\eqref{eq:13}的递归结构,研究人员必须坚持这样一个假设,即社会效应的传播确实遵循假定的时间模式。但实证研究通常无法提供任何特定时间的证据。一些作者假设个人受其同时代人行为的影响,一些作者假设时间滞后几年,还有一些作者假设社会效应是跨代作用的。 5. 需求分析 在第 1 节中,我指出主流经济需求模型体现了一种内生的社会效应:个人对产品的需求随价格的变化而变化,而价格部分由相关市场的总需求决定。本节将对此进行详细阐述。 让 y 表示消费者对特定产品的需求。让 x 表示消费者所在的市场;例如,不同的 x 值可能指不同的地理区域或不同的时间段。那么,传统的消费者需求模型假定,在消费者属性的条件下,消费者所在的市场仅通过该市场的现行价格影响需求。一个常见的经验公式是 \begin{equation}\label{eq:14} E(y|x,z)=D[p(x),z], \end{equation} 其中,z 是研究者观察到的消费者属性,$D(\cdot , \cdot)$ 是以 (x, z) 为条件的平均需求量。 市场均衡模型假定价格 p(x) 由市场 x 的总需求和该市场的供给条件决定。假设生活在市场 x 中的消费者人数为 m(x)。那么 E(y|x) 是市场 x 的人均需求,E(y|x)m(x) 是总需求。让$s(x)$表示相关的供给条件。那么 \begin{equation}\label{eq:15} p(x)=\pi[E(y|x)m(x),s(x)] \end{equation} 表达了供求关系对价格的决定作用。 公式\eqref{eq:14}和\eqref{eq:15}意味着 \begin{equation}\label{eq:16} E(y|x,z)=D\{\pi[E(y|x)m(x),s(x)],z\}. \end{equation} 这是一个与\eqref{eq:8}不同的内生效应模型。以 z 为条件,y 只通过\eqref{eq:8}中的 E (y |x) 随 x 变化,但通过\eqref{eq:16}中的 [E (y |x)m(x), s(x)]随 x 变化。如果 $m(\cdot)$和 $s(\cdot)$不随 x 变化,即如果所有市场的消费者规模相同,且各市场的供应条件.是同质的,则等式 (16) 变为 (8)。在这种情况下,不同市场的价格变化完全来自消费者属性分布 p(z |x) 的变化。第 2 节和第 3 节的结论适用于确定消费者需求函数的问题。 6. 结论 本文分析了从对总体行为分布的观察中确定内生社会效应的问题。我们发现,如果界定参照群体的属性与直接影响结果的属性有适度的相关性,那么推断内生效应的前景可能是现实的。另一方面,如果这些属性要么在功能上相互依赖,要么在统计上相互独立,那么推断的前景就很差,甚至为零。此外,对行为的观察也不能用来确定个人的参照群体。 改善鉴定前景的唯一办法是发展更严密的理论或收集更丰富的数据。我对更严密的理论没有什么想法,但我认为我们可以做很多事情来收集更丰富的数据。本文的分析假定推论只基于观察到的行为。经验证据也可以从受控实验和主观数据中获得,主观数据就是人们对自己行为原因的陈述。(Jones (1984) 调查了社会心理学家进行的一些实验)。鉴于仅根据观察到的行为进行识别非常不可靠,实验和主观数据将在未来了解社会效应的工作中发挥重要作用。

  1. 在社会学文献中,这被称为 “情境效应”。20 世纪 60 年代,社会学家开始大力研究学校和社区环境对青少年的影响(如 Coleman 等人 (1966);Sewell 和 Armer (1966)),对环境效应的推断成为社会学家关注的一个重要问题。近来,人们对底层社会空间概念的兴趣再次升温,催生了许多新的实证研究(如 Crane (1991)、Jencks and Mayer (1989) 和 Mayer (1991))。我使用 “外生 “效应一词作为背景效应的代名词,以区别于内生效应。
  2. 从海曼(1942 年)开始,社会学参照群体理论试图表达这样一种观点,即个人从某些参照群体的行为和态度中学习或受到其影响。Bank、Slavings 和 Biddle(1990 年)对这一理论进行了历史性的阐述。社会学著作仍以口头表述为主,但经济学家已按照第(2)段的方式将参照群体解释为条件变量。参见 Alessie 和 Kapteyn (1991) 或 Manski (1993a)。
  3. 如果 (x, z) 的支持是离散的,则可使用细胞平均估计值。如果假设(ii)成立,可以使用各种非参数回归估计;例如,参见 Hardie (1990)。假设(i)和(ii)涵盖了许多但并非所有与经验相关的情况。它们似乎不适合小群体社会互动研究,如家庭互动。在家庭互动的分析中,每个参照群体(即家庭)的规模相对于人口来说微不足道,对个人的随机抽样通常不会产生同一家庭的多个成员。因此,假设 (x, z) 具有离散支持并不是一个好的经验近似。此外,除非我们能以某种方式将不同的族描述为在组成上相似,否则就不能假设$[E(y \mid x, z), E(y \mid x), E(z \mid x)]$是连续的。对个体进行随机抽样并不是研究家庭互动的有效数据收集过程。最好以家庭为抽样单位。
  4. 群体中的线性独立性意味着[1,E(z|x),x,z]分布的支持不是$R^1\times R^J\times R^K\times R^1$的适当线性子空间。
  5. 在对不确定情况下的决策进行实证研究时,也发现了同样的做法。研究人员假定他们知道个人是如何形成预期的,但却没有提供任何证据来证明他们的假定是正确的。我最近在研究学校教育选择时批评了这种做法。见 Manski (1993b)。

One thought on “内生社会效应的识别:反射问题

  1. An effective SEO company for promoting your website, your key to online success.
    How to choose the best SEO company, tips from experts.
    Advantages of working with experienced SEO specialists, growth of your sales.
    An article about the best SEO companies, customers’ experience.
    Effectiveness of an SEO company for your website, key benefits.
    webdesign agency australia http://seorg-seo.com/ .

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注