您的位置首页  文化资讯  文化

文化含义是什么文化的几何学:通过词嵌入方法分析阶层的含义

  • 来源:互联网
  • |
  • 2023-04-09
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

文化含义是什么文化的几何学:通过词嵌入方法分析阶层的含义

  阶级寄义多个维度之间的干系图2将核心从富有扩展到了。发作了经济变化虽然20世纪,度之间仍旧十分不变但阶级的各个文明维。育一直严密相连涵养、品德和教,水平适度相干与职位和富有,险些是无关的但与失业情况。有相反的联络失业与品德,被以为有一种负面的品德寄义阐明店主相对被雇佣者来讲,位有着正向的联络但却与充足和地。

  言处置手艺的开展比年来跟着天然语,用时性阐发曾经成为能够关于大范围文本数据停止。beddings)作为研讨文明的主要东西该文作者提出词嵌入模子(word em,这一观点为例并以社会阶级,层文明寄义在已往一百多年中的变化向我们展现了英语天下关于社会阶。示为高维空间中的一个向量词嵌入模子将每个单词表,量化单词之间的语义类似水平经由过程计较词向量之间的间隔来。文明寄义的一种表示假如我们将语义视为,为对文明在多少学意义上的显现词向量及其语义空间便可被了解。入模子归入文明阐发最早的作品之一该文是将基于深度进修根底上的词嵌,、和社会分层等范畴的研讨都具有鉴戒意义关于计较社会科学、文明社会学、文明研讨。

  数级增加的布景下在数字化文本呈指,化供给了壮大的东西词嵌入模子为阐发文。越传统办法的劣势这类模子具有超,理大型语料库能够用于处,的语义干系展示出丰硕。嵌入模子经由过程词,的方法探究文明静态研讨职员可以以立异,种联系关系捕获多,的文明表征并供给庞大。现出文明的多面性这类高维度模子呈,不竭变革的特征突显其奇妙而,织和自觉的社会举动的了解从而能够增长我们对有组。

   Ngram中20世纪的文本本文作者利用了Google,位分别为10组语料将其根据10年为单,法的skipgram架构并操纵word2vec算,空间维度为300的词嵌入模子将差别年月的语料锻炼为10个。为由单词构成的语义空间这些词向量空间能够了解,特定的坐标地位每一个单词都有其。之间的坐标间隔经由过程计较词向量,间的语义类似水平能够量化差别词之。阶级操纵化为了将社会,富有水平(affluence)该研讨将其分别为7个文明维度:,oyment)失业(empl,tatus)名誉职位(s,cation)教诲(edu,tivation)档次教化(cul,rality)品德行(mo,ender)和性别(g。联系关系的反义词构建每个维度由语义,词组之间差别的均匀值而得经由过程计较每维度反义词,rich- poor比方富有维度可经由过程,tute等词组差值的均匀值计较affluent-desti。

  —与其他维度之间的干系停止了阐发(图1)作者起首对富有水平—这一阶级的中心寄义。ine similarity在差别年月的变革经由过程计较富有维度向量与其他维度向量的cos,发明作者,)的干系最为微小(接近0)富有与失业(店主或被雇佣,望的干系最为亲密而与文明涵养和声。解中与财产积聚亲密相干虽然失业职位在社会学理,它的联系关系性却相对较弱但在普通社会话语中。和布迪厄的概念相分歧作者以为这与马克思,支持经济条理体系即消费干系固然,是愈加可见且具有文明意味意义的但阶级的外在意味(如消耗形式)。外此, - female)与富有水平具有正向联系关系作者发明女性特质(性别维度向量为male。与汗青布景有关作者以为这能够,层社会中由于在上,男性“代办署理消耗”的东西老婆和女儿经常被视为,性恰是他们阶级身份的意味无需事情、浪费财产的女。时同,世纪末在20,联系关系变得愈来愈亲密教诲与富有水平的,一切维度超越其他。教诲活着界范畴内的大范围扩大这阐明20世纪下半叶以来跟着,化会商中在大众文,财产积聚中阐扬的感化愈来愈大人们以为教诲在社会经济成绩和。

  ogle Ngram语料库该研讨次要数据滥觞为Go,范围电子文本数据库为英语天下现存最大,上出书册本的6%包括了人类汗青。类文本的出书工夫该语料库包罗各,词组在差别年月的语义变革因而能够用于阐发统一词或。库中20世纪出书的文本本文次要利用的是该语料。本数据来构建不变精确的语义联络词嵌入模子凡是需求极大范围的文,这一办法探求观点同享寄义的最好数据滥觞Google Ngram因而成为利用。意的是值得注,据的特别性因为文本数,能被以为是具有普通代表性该语料库展示的文明其实不,界精英群体的文明特征而更多地反应英语世。外此,今世问卷、汗青问卷文章作者还利用了,on Crawl)来考证Google Ngram结论的牢靠性和其他电子化文本数据(如Google News和Comm。

  是社会分层研讨范畴最为中心的观点之一社会阶级(social class),会经济构造中的地位旨在权衡个别在社。将其视为一个多维度观点今世社会科学研讨凡是,职业和教诲等方面次要包罗支出、。而然,不单单是经济职位的表现愈来愈多的学者指出阶级,还具有意味性的寄义并且在一样平常糊口中。和名誉群体的辨别从韦伯对经济阶级,的文明本钱到布迪厄,包罗物资上的劣势都夸大了阶级不只,和档次等意味性劣势还包罗名誉、涵养。外此,别寄义也愈来愈遭到存眷阶级中的品德寄义和性。外此,寄义也逐渐遭到更多存眷阶级中的品德寄义与性别。层维度停止了普遍的研讨固然已往的研讨对各个阶,工夫的推移而配合演化仍旧需求进一步研讨可是这些维度之间的干系和它们怎样跟着。此因,对上百万册英语册本停止定量式文本阐发本文利用词嵌入这一天然言语处置模子,个成绩:第一以答复以下两,间怎样互相联系关系?第二社会阶级的文明维度之,社会的变革跟着经济和,何随工夫演化这些维度如?

  过联系关系辞汇的变化展示文明寄义的变化还可通。失业维度上联系关系水平最高的单词图3展现了20世纪初和末期在,mployer)干系亲密正向联系关系暗示与店主(e,employee)干系亲密负向联系关系则代表与被雇佣者(。纪早期活着,头衔(如lords与正式职位相干的,与店主寄义最为相干governor),”则与被雇佣者更加相干而“人为”和“打工人。间推移跟着时,落空劣势头衔逐步,相干的术语(如promoter代之以与产业和金熔化经济系统,latorspecu,valri,ul)mog;世纪末而在,了“退休”、“资历”被雇佣者的寄义转向,和“门生”“赋闲”,新兴的文明征象这表清楚明了一种,化的白领阶级和中产阶层行将被雇佣者视为专业。

  构在磅礴消息上传并公布本文为磅礴号作者或机,者或机构概念仅代表该作,闻的概念或态度不代表磅礴新,供信息公布平台磅礴消息仅提。请用电脑会见申请磅礴号。

  往文本阐发办法的范围性词嵌入模子有用处理了以。文本阐发定性式,析和定性编码办法如阐释性文天职,大范围文本没法阐发,者本身的阐释且有赖于研讨,反复性缺少可。式办法定量,阐发与主题建模好比语义收集,文本数据成为能够固然使阐发大范围,理多维度之间联系关系方面存在不敷但在捕获词之间的持续干系和处。高维空间中的持续向量词嵌入模子将词暗示为,的更详尽阐发成为能够这使得对词之间干系。

  该研讨以社会阶级这一社会学的中心观点为例文明寄义跟着社会经济变化将发作何种变革?,百年间有关阶级寄义的变化向我们展现了在20世纪一。的数百万本册本中的文本经由过程阐发已往一百年出书,纪经济变化的不竭促进作者发明跟着20世,志连续发作变革阶级的详细标,连结着明显的不变性但根本的文明维度却。破例是教诲值得留意的,系变得愈加严密它与财产的联,系不再那末严密与文明教化的联。

  模子阐发社会阶级在20世纪寄义的变化该研讨接纳word2vec这一词嵌入。示为高维空间中的一个向量词嵌入模子将每个单词表,的单词会在空间中地位附近在文本中同享类似高低文,单词则会在空间中地位较远而在不相干高低文中呈现的。入模子中在词嵌,ity来丈量两个词向量之间的空间间隔凡是利用cosine similar。为普遍利用的词嵌入算法之一Word2vec是今朝最,神经收集架构其接纳两层,高低文来优化单词猜测经由过程与其他单词的同享。向量空间中在此嵌入,常常具有类似的寄义地位靠近的词向量。话说换句,义词大概具有类似寄义的向量占有一个词向量的四周空间凡是为其近。sine similarity来丈量两个单词之间语义类似水平便可用co。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:文化含义是什么
  • 编辑:刘昆
  • 相关文章
TAGS标签更多>>