AI训练模型

商汤日日新大模型

商汤科技推出的大模型体系,提供自然语言处理、图片生成等多种能力,助力各行业智能化创新。

商汤日日新大模型:简介

商汤日日新大模型(SenseNova)是商汤科技推出的通用人工智能大模型体系,于2023年4月首次发布,并在2025年升级为融合多模态能力的行业标杆产品。该模型以“苟日新,日日新,又日新”为核心理念,通过混合专家架构(MoE)和超10TB tokens的高质量训练数据,实现了语言理解、图像生成、逻辑推理等多模态任务的统一处理。在权威评测OpenCompass和SuperCLUE中,日日新大模型多次超越GPT-4 Turbo等国际竞品,成为中文大模型领域的“双冠王”。

核心特点

多模态融合能力:支持文本、图像、视频、语音等多源信息联合处理,例如通过OCR识别手写文档、分析复杂图表、生成数字人视频等,覆盖办公、教育、金融等场景。

深度推理与逻辑能力:在数学、物理等理科任务中表现卓越,MathVista评测得分达78.4分,可解高考数学题并提供详细步骤,助力科研与工程分析。

高效开发支持:提供低代码开发框架LazyLLM,仅需10行代码即可构建多Agent应用,支持快速部署至网页、企业微信等平台。

行业场景适配:已在智能驾驶、医疗问诊、金融文档分析等领域落地,例如“办公小浣熊”工具可自动处理富模态文件,提升企业效率。

如何使用日日新大模型?

1. 注册与登录:访问商汤科技官网(https://platform.sensenova.cn/),完成企业或个人开发者账号注册。

2. 选择模型服务:在控制台选择“日日新”系列模型,根据需求调用API接口(如文本生成、图像分析、代码编写)。

3. 输入与调试:通过自然语言或上传文件输入任务指令,例如“分析2023年财务报表并生成可视化图表”。

4. 参数优化:在高级设置中调整temperature(创意度)、max_tokens(生成长度)等参数,平衡输出质量与效率。

5. 获取结果:模型将在秒级内返回处理结果,支持JSON、Markdown等多种格式导出。

价格与计费模式

个人开发者:基础版定价30港元/百万tokens,支持128K上下文窗口,适用于小型项目测试。

企业用户:按需定制套餐,提供私有化部署、数据隔离服务,价格根据并发量和训练资源浮动。

免费试用:新用户可领取1万tokens免费额度,体验文生图、代码生成等功能。

实用Tips

• 输入指令时尽量明确场景与格式要求,例如“用学术语言总结以下论文”比“总结内容”效果更佳。

• 多模态任务建议上传文件与文字描述结合,例如“分析附件Excel中2024年Q1销售趋势,并用柱状图展示”。

• 关注官网每月更新的能力列表,例如2025年新增的实时视频流解析功能可优化直播场景交互。

常见问题解答

Q:日日新大模型适用于哪些行业?
A:已覆盖金融、医疗、教育、智能制造、自动驾驶等领域,特别擅长处理表格、报告、影像等复杂数据。

Q:模型输出的内容如何保障合规性?
A:商汤内置AI伦理审查机制,支持敏感词过滤、版权检测,并提供企业级内容审核API定制服务。

Q:是否支持本地化部署?
A:支持私有化部署方案,最低配置要求为8卡A100服务器,提供全流程数据加密与运维支持。

相关导航

暂无评论

暂无评论...