
清华大学自然语言处理与社会人文计算实验室(THUNLP)是中国自然语言处理(NLP)领域的先驱之一,隶属于清华大学人工智能研究院。自20世纪70年代末成立以来,THUNLP在中文信息处理、跨模态大模型、知识图谱、机器翻译等方向持续深耕,取得了广泛的国际影响力。 实验室概况 THUNLP由孙茂松教授、刘洋教授和刘知远副教授共同领导,致力于以...
所在地:
中国
语言:
简体中文
收录时间:
2025-05-16

清华大学自然语言处理与社会人文计算实验室(THUNLP)是中国自然语言处理(NLP)领域的先驱之一,隶属于清华大学人工智能研究院。自20世纪70年代末成立以来,THUNLP在中文信息处理、跨模态大模型、知识图谱、机器翻译等方向持续深耕,取得了广泛的国际影响力。
实验室概况
THUNLP由孙茂松教授、刘洋教授和刘知远副教授共同领导,致力于以中文为核心的自然语言处理研究。实验室承担了国家973项目、国家重点研发项目等多项重要研究任务,并与腾讯、华为等企业建立了紧密的学术合作关系。
核心研究方向
1. 语言与跨模态大模型
THUNLP在大语言模型(LLM)和多模态智能体方面取得了显著进展。例如,与ModelBest联合开发的AgentCPM-GUI模型,基于MiniCPM-V架构,拥有80亿参数规模,能够在移动终端上高效运行,支持中文应用的GUI操作任务。
2. 中文信息处理工具
实验室开发了多款高效的中文NLP工具,如:
THULAC:一款高效的中文词法分析工具,具有中文分词和词性标注功能,分词F1值可达97.3%。
DeepTHULAC:基于自研BERT模型的中文词法分析工具,分词F1值可达97.6%。
THUCTC:中文文本分类工具包,支持用户自定义的文本分类语料的训练、评测和分类功能。
3. 开源项目与社区贡献
THUNLP积极推动科研成果的开源共享,其GitHub项目如THULAC、THUCTC等获得了超过1万颗星标,广泛应用于学术研究和工业实践中。
人才培养与合作
实验室长期招募博士后、研究员和实习生,提供充足的算力、数据和经费支持,以及具有竞争力的薪资待遇。THUNLP注重人才培养,致力于打造开放、协作的科研环境,欢迎有志于自然语言处理研究的学者和工程师加入。
结语
作为中国自然语言处理领域的领军实验室,THUNLP在中文信息处理、大语言模型、多模态智能等方向持续创新,推动人工智能技术的发展和应用。其在学术研究、技术开发和人才培养方面的成就,彰显了清华大学在人工智能领域的雄厚实力和前瞻布局。
相关导航

华中科技大学人工智能与自动化学院的非全日制作息安排,可能就是为你量身定制的金钥匙!用三年周末时间,换来国家认可的学历和学位双证,一步到位解锁更广阔的职业赛道。

Findly
Findly.ai深度体验:打破数据壁垒,用聊天解锁隐藏的商业洞察力

国防科技大学智能科学学院
国防科技大学智能科学学院将顶尖AI研发力量集中于解决国家战略与产业核心难题,技术可靠深具壁垒、高度定制化。

中国中文信息学会
打造中文智能未来的国家学术中枢

卡内基梅隆大学
卡内基梅隆大学以其跨学科基因、顶尖实验室配置和强悍的产学转化力,持续引领人工智能等关键领域的实用型创新研究。

北京理工大学计算机学院
跻身全球前列的计算机强校,培养AI与智能科技领域顶尖人才的投资型平台

NLTK
NLTK帮你打通文本处理全流程,用学术级的免费工具打造商业级应用

中潮AI
专注智能文案创作与内容优化的AI生产力工具
暂无评论...