PSYCH OpenIR
基于词嵌入技术的心理学研究:方法及应用
其他题名Using word embeddings to investigate human psychology:Methods and applications
包寒吴霜1,2,3; 王梓西1,2; 程曦1,2; 苏展1,2; 杨盈1,2; 张光耀1,2,4; 王博5; 蔡华俭1,2
第一作者包寒吴霜
通讯作者邮箱caihj@psych.ac.cn (蔡华俭)
心理所单位排序1
摘要

词嵌入是自然语言处理的一项基础技术其核心理念是根据大规模语料中词语和上下文的联系,使用神经网络等机器学习算法自动提取有限维度的语义特征,将每个词表示为一个低维稠密的数值向量(词向量),以用于后续分析心理学研究中,词向量及其衍生的各种语义联系指标可用于探究人类的语义加工、认知判断、发散思维、社会偏见与刻板印象、社会与文化心理变迁等各类问题未来,基于词嵌入技术的心理学研究需要区分心理的内隐和外显成分,深化拓展动态词向量和大型预训练语言模型(如GPT,BERT)的应用,并在时间和空间维度建立细粒度词向量数据库,更多开展基于词嵌入的社会变迁和跨文化研究我们为心理学专门开发的R语言工具包PsychWordVec可以帮助研究者利用词嵌入技术开展心理学研究。

其他摘要

As a fundamental technique in natural language processing(NLP),word embedding quantifies a word as a low-dimensional,dense,and continuous numeric vector(i.e.,word vector).Word embeddings can be obtained by using machine learning algorithms such as neural networks to predict the surrounding words given a word or vice versa(Word2Vec and FastText)or by predicting the probability of co-occurrence of multiple words(GloVe)in large-scale text corpora.Theoretically,the dimensions of a word vector reflect the pattern of how the word can be predicted in contexts;however,they also connote substantial semantic information of the word.Therefore,word embeddings can be used to analyze semantic meanings of text.In recent years,word embeddings have been increasingly applied to study human psychology,including human semantic processing,cognitive judgment,divergent thinking,social biases and stereotypes,and sociocultural changes at the societal or population level.Future research using word embeddings should(1)distinguish between implicit and explicit components of social cognition,(2)train fine-grained word vectors in terms of time and region to facilitate cross-temporal and cross-cultural research,and(3)apply contextualized word embeddings and large pre-trained language models such as GPT and BERT.To enhance the application of word embeddings in psychology,we have developed the R package“PsychWordVec”,an integrated word embedding toolkit for researchers to study human psychology in natural language.

关键词自然语言处理 词嵌入 词向量 语义表征 语义关联 词嵌入联系测验
2023
语种中文
DOI10.3724/SP.J.1042.2023.00887
发表期刊心理科学进展
ISSN1671-3710
卷号31期号:6页码:887-904
期刊论文类型综述
收录类别CSCD
CSCD记录号CSCD:7482156
引用统计
被引频次:2[CSCD]   [CSCD记录]
文献类型期刊论文
条目标识符http://ir.psych.ac.cn/handle/311026/46441
专题中国科学院心理研究所
作者单位1.中国科学院心理研究所行为科学重点实验室,北京100101
2.中国科学院大学心理学系,北京100049
3.英国曼彻斯特大学曼彻斯特中国研究院,曼彻斯特M 13 9PL
4.北京师范大学认知神经科学与学习国家重点实验室和IDG/麦戈文脑科学研究院,北京100875
5.天津大学智能与计算学部,天津300350
第一作者单位中国科学院心理研究所
推荐引用方式
GB/T 7714
包寒吴霜,王梓西,程曦,等. 基于词嵌入技术的心理学研究:方法及应用[J]. 心理科学进展,2023,31(6):887-904.
APA 包寒吴霜.,王梓西.,程曦.,苏展.,杨盈.,...&蔡华俭.(2023).基于词嵌入技术的心理学研究:方法及应用.心理科学进展,31(6),887-904.
MLA 包寒吴霜,et al."基于词嵌入技术的心理学研究:方法及应用".心理科学进展 31.6(2023):887-904.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于词嵌入技术的心理学研究:方法及应用.(1482KB)期刊论文出版稿限制开放CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[包寒吴霜]的文章
[王梓西]的文章
[程曦]的文章
百度学术
百度学术中相似的文章
[包寒吴霜]的文章
[王梓西]的文章
[程曦]的文章
必应学术
必应学术中相似的文章
[包寒吴霜]的文章
[王梓西]的文章
[程曦]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 基于词嵌入技术的心理学研究:方法及应用.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。