7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访。在2023世界人工智能大会上,该公司发布了一种大模型产品生态——“天壤小白”。其中包含最高1860亿参数的通用大语言模型、语义搜索引擎和开发平台。
目前,国内已是“百模混战”,天壤推出的大模型生态有何别致之处呢?薛贵荣首先向记者介绍了大模型存在的四大挑战,即大模型产生真假难辨的“幻觉”,所谓“一本正经的胡说八道”;政企私有数据的保密性要求,不能对外公开;缺少可靠的企业级中文大模型;大模型存在封闭性,无法自动更新信息。
关于天壤如何解决大模型“一本正经的胡说八道”,薛贵荣表示:“用‘提示词’去控制大模型,大模型还是会胡说八道。后来,有人尝试输入一些简单的上下文,以及对大模型进行fine-tune,但这个也不够。我们为了解决‘幻觉’问题,做了一个语义搜索引擎。先把需要的所有文档,放到语义引擎里面,比如法律书、知识库或者企业内部各种数据。该引擎使用了一个核心技术,即embedding。”