AI大模型是“人工智能预训练大模型”的简称,一种机器学习模型,包含了“预训练”和“大模型”两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。
大模型也从2012年的萌芽期,发展到2016年的AI1.0时期,再到2022年ChatGPT带来的AI2.0时期,模型参数均较前一代有数量级的飞跃,如OpenAI最新发布的多模态预训练大模型GPT-4约有超过2000亿参数,谷歌新推出“通才”大模型PaLM-E,拥全球已公开的最大规模的5620亿参数,能够表现出更优秀的性能和应用价值。目前,国内AI大模型研发和应用领域也正迎来高速发展热潮。
本文总结了目前国内面向公众开放的大模型,供大家测试使用。
复旦-MOSS
复旦大学MOSS大模型是国内第一个发布的对话式大型语言模型。它可以执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。
体验方式:
https://moss.fastnlp.top/?ref=openi.cn
百度-文心一言
文心一言是由百度公司开发的人工智能语言模型,能够帮助用户完成各种任务,包括文本问答、文学创作、解答数学题等。该模型基于深度学习技术进行训练和优化,具有知识增强、多轮深度对话、多语言支持等技术特点。
体验方式:
https://yiyan.baidu.com
科大讯飞-星火
讯飞星火大模型是科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。
体验方式:
https://xinghuo.xfyun.cn/
阿里云-通义
阿里云通义大模型是阿里大模型统一品牌,覆盖语言、听觉、多模态等领域致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”。通义千问是阿里巴巴自研的预训练语言模型,具有多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。
体验方式:
https://tongyi.aliyun.com/
展开全文
字节跳动-云雀
字节跳动基于云雀大模型开发了一款生成式AI助手“豆包”。用户通过与豆包进行对话,可自动生成歌词、小说、文案等文本内容。每段回答除了文字外,也会由数字人豆包进行语音回答。
体验方式:可以下载APP使用或通过官网在线使用https://www.doubao.com/login。
智谱华章-智谱清言
智谱清言是由北京智谱华章科技有限公司开发的一款生成式AI聊天助手。该助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术,以通用对话的形式为用户提供智能化服务。智谱清言具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力。
体验地址:
https://chatglm.cn/
华为-盘古
华为盘古大模型是国内首个全栈自主的AI大模型,有盘古NLP大模型(对话问答,代码生成,文案生成,Versatile,NL2SQL), 盘古CV大模型,盘古多模态大模型(图形生成,图像编辑,3D生成),盘古预测大模型,盘古科学计算大模型等,致力于深耕行业,打造金融、政务、制造、矿山、气象、铁路等领域行业大模型和能力集,应用场景会议助手,以文生图,中长期天气预报,财务异常检测,万物分割等,将行业知识know-how与大模型能力相结合,重塑千行百业,成为各组织、企业、个人的专家助手。
体验地址:https://pangu.huaweicloud.com/index.html?ref=openi.cn
中科院-紫东太初
紫东太初是中科院自动化所与MindSpore社区联合打造的全球首个图、文、音三模态大模型。
紫东太初将文本 + 视觉 + 语音各个模型高效协同,实现超强性能,在图文跨模态理解与生成性能上都能领先目前业界的SOTA模型,高效完成跨模态检测、视觉问答、语义描述等下游任务。
体验地址:https://xihe.mindspore.cn/modelzoo/taichu/introduce
百川智能-百川大模型
百川智能成立于2023年4月,由前搜狗公司CEO王小川创立。
百川智能成立不到100天,便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的百川大模型,并且在多个权威评测榜单均名列前茅。
体验地址:
https://www.baichuan-ai.com/home
商汤-商量SenseChat
今年4月,商汤正式推出了商量SenseChat,是国内最早发布的千亿参数大语言模型之一。
目前,它在语言、知识、理解、推理和学科五大能力上均处于行业领先水平,可以处理各类文本和信息,成为随身综合知识库、高效文本编辑器、数理计算器和简单易用的编程助手。
据介绍, 商量SenseChat背后依托的是商汤人工智能大装置SenseCore,其上线GPU数量已由今年3月底的 27000块提升至30000块左右,算力规模提升了20%,达到6ExaFLOPS,能有效支持语言大模型的训练、升级迭代和服务。
体验地址:
https://chat.sensetime.com/wb/#/login
MiniMax-ABAB
Minimax成立于2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰创立。
自成立以来,Minimax在AI领域取得了显著的进展。该公司已经发布了包括文本到视觉、语音、文本三个基础模型架构,并推出了自主研发的通用大模型“ABAB”
体验地址:
https://api.minimax.chat/
上海人工智能实验室-书生通用
书生通用大模型突破了光标指令交互、利用语言定义任意任务和轻量级自适应融合等多项关键技术,实现了开放世界理解、多模态交互和跨模态生成三大能力,支持350万种语义标签。
目前,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和 “书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。
体验地址:
https://intern-ai.org.cn/home
腾讯-混元
腾讯云混元大模型是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。
体验地址:
https://hunyuan.tencent.com/
扫描加入免费的「智慧城市之智慧交通」知识星球可了解更多行业资讯和资料。
评论列表