清华大学THUNLP实验室

2周前更新 11 00

清华大学自然语言处理与社会人文计算实验室(THUNLP)是中国自然语言处理(NLP)领域的先驱之一,隶属于清华大学人工智能研究院。自20世纪70年代末成立以来,THUNLP在中文信息处理、跨模态大模型、知识图谱、机器翻译等方向持续深耕,取得了广泛的国际影响力。 实验室概况 THUNLP由孙茂松教授、刘洋教授和刘知远副教授共同领导,致力于以...

所在地:
中国
语言:
简体中文
收录时间:
2025-05-16
清华大学THUNLP实验室清华大学THUNLP实验室

清华大学自然语言处理与社会人文计算实验室(THUNLP)是中国自然语言处理(NLP)领域的先驱之一,隶属于清华大学人工智能研究院。自20世纪70年代末成立以来,THUNLP在中文信息处理、跨模态大模型、知识图谱、机器翻译等方向持续深耕,取得了广泛的国际影响力。

实验室概况

THUNLP由孙茂松教授、刘洋教授和刘知远副教授共同领导,致力于以中文为核心的自然语言处理研究。实验室承担了国家973项目、国家重点研发项目等多项重要研究任务,并与腾讯、华为等企业建立了紧密的学术合作关系。

核心研究方向

1. 语言与跨模态大模型

THUNLP在大语言模型(LLM)和多模态智能体方面取得了显著进展。例如,与ModelBest联合开发的AgentCPM-GUI模型,基于MiniCPM-V架构,拥有80亿参数规模,能够在移动终端上高效运行,支持中文应用的GUI操作任务。

2. 中文信息处理工具

实验室开发了多款高效的中文NLP工具,如:

  • THULAC:一款高效的中文词法分析工具,具有中文分词和词性标注功能,分词F1值可达97.3%。

  • DeepTHULAC:基于自研BERT模型的中文词法分析工具,分词F1值可达97.6%。

  • THUCTC:中文文本分类工具包,支持用户自定义的文本分类语料的训练、评测和分类功能。

3. 开源项目与社区贡献

THUNLP积极推动科研成果的开源共享,其GitHub项目如THULAC、THUCTC等获得了超过1万颗星标,广泛应用于学术研究和工业实践中。

人才培养与合作

实验室长期招募博士后、研究员和实习生,提供充足的算力、数据和经费支持,以及具有竞争力的薪资待遇。THUNLP注重人才培养,致力于打造开放、协作的科研环境,欢迎有志于自然语言处理研究的学者和工程师加入。

结语

作为中国自然语言处理领域的领军实验室,THUNLP在中文信息处理、大语言模型、多模态智能等方向持续创新,推动人工智能技术的发展和应用。其在学术研究、技术开发和人才培养方面的成就,彰显了清华大学在人工智能领域的雄厚实力和前瞻布局。


相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...