文件列表:
安信证券:电子行业周报:国内AI生态建设加速,智能驾驶进程持续推进.pdf |
下载文档 |
资源简介
>
“书生·万卷”预训练语料开源发布,赋能国产AI生态建设:8月14日,上海AI实验室宣布,联合中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所等语料数据联盟成员,共同开源发布“书生·万卷”1.0多模态预训练语料。“书生·万卷”1.0目前包含文本数据集、图文数据集、视频数据集三部分,本次开源的数据总量超过2TB。该语料数据包含超过5亿个文本,2200万个图文交错文档,1000个节目影像视频,具备多元融合、精细处理、价值对齐、易用高效等四大特征。7月6日,上海AI实验室已发布全新升级的“书生通用大模型体系”,并且推出了书生·浦语开源体系,它不仅开放了一个高质量的语言大模型InternLM-7B,在多项主流评测中性能领先于Llama-2-7B,还提供了覆盖从数据、训练到评测的全链条开放体系。“书生·万卷”已被用于书生大模型预训练,其开源发布将进一步降低大模型技术探索和落地门槛,赋能国内AI产业。科大讯飞发布讯飞星火大模型V2.0,AI算力需求进一步加大8月15日,科大讯飞召开讯飞星火大模型V2.0发布会。相比于5月6日发布的1.0版本,讯飞星火大模型V2.0在代码能力和多模态能力
加载中...
已阅读到文档的结尾了



