文件列表:
甬兴证券:计算机行业周报-全球AI产业跟踪:Nvidia发布6.3万亿Token大型AI训练数据库.pdf |
下载文档 |
资源简介
>
核心观点
Nvidia:发布6.3万亿Token大型AI训练数据库
据IT之家,近日英伟达宣布推出一款名为Nemotron-CC的大型英文AI训练数据库,总计包含6.3万亿个Token,其中1.9万亿为合成数据。Nemotron-CC的开发过程中使用了模型分类器、合成数据重述(Rephrasing)等技术,最大限度地保证了数据的高质量和多样性。同时他们还针对特定高质量数据降低了传统的启发式过滤器处理权重,从而进一步提高了数据库高质量Token的数量,并避免对模型精确度造成损害。
Adobe:推出新款生成式AI工具
据IT之家,近日Adobe宣布推出一系列全新的生成式AI工具,旨在自动化处理劳动密集型生产任务,例如批量编辑图像和翻译视频演示文稿,其中包括“FireflyBulkCreate”应用,该工具允许用户一键快速调整多达10,000张图像的尺寸或替换所有背景,从而避免繁琐的逐张编辑操作。
Salesforce:称微软Copilot使用率低
据IT之家,近日Salesforce首席执行官马克・贝尼奥夫表示基于客户反馈,微软Copilot并未给客户带来变革性的体验,使用率极低,客户更倾
加载中...
已阅读到文档的结尾了



