藏语基座大模型“阳光清言”上线

11月19日，西藏拉萨市正式把一个千亿级参数的藏语基座大模型“阳光清言”发布出来。中新社记者贡桑拉姆就在拉萨现场报道了这件事儿。这款模型由中国工程院院士尼玛扎西带领的团队和北京智谱华章科技有限公司合作开发，专门用于提升藏语智能技术的国际话语权，还能给西藏的长治久安和高质量发展提供技术支持。现在团队已经按照国家的规定在推进模型备案的工作，等这一步走完，这个大模型就能正式上线给大家用了。尼玛扎西教授是西藏大学的教授，也是这个项目的领头人。他介绍说，“阳光清言”V1.0用了大约288亿个高质量的藏语文本token来训练，内容包括新闻、法律、医学、哲学、教育、文化和科学技术这些不同的领域。尼玛扎西还提到，“阳光清言”藏语大模型不光懂藏语，在汉语上也很厉害。洛桑嘎登是西藏大学信息科学技术学院的副教授，也是尼玛扎西院士的团队成员。他说这个模型可以处理复杂的语言结构和多领域知识，问答起来自然流畅、生成的文本也很明晰准确。它在智能问答、文本生成、机器翻译这些方面表现都非常好。除了藏语能力强，“阳光清言”还是个很棒的基座模型。洛桑嘎登说它可以广泛应用于边疆治理、西藏文旅、绿色能源、农牧科研、教育、文化还有藏医药与高原健康这些方面的大模型研发。它的重点就是要解决边疆数智治理中的语言技术支撑问题、市域和区域治理能力的提升、民生服务能力的提升，还有AI赋能文化旅游产业和高原科学技术研究、清洁能源开发利用智能化这些关键技术。