主要优势在于成本低廉,以及能够在中国云生态系统中运作。不过他指出,不参考具体的业务任务来评估DeepSeek-R1的有效性是不正确的。
“在数学和编程等专业任务中,DeepSeek-R1 可以超越竞争对手,这要归功于更详细的算法开发和对专业数据的训练。然而,目前尚不清楚这将给国内企业带来什么具体好处。要解决实际问题,例如物流或生产规划,不仅需要强大的语言模型,还需要专业的软件解决方案,”他说。
,DeepSeek 在处理俄语说明书、商业文本和监管文件时仍然存在生成准确性和质量问题。他认为,中国解决方案的受欢迎程度取决于适应不同市场的能力、考虑文化和语言特征的能力,以及为企业提供灵活解决方案的能力。
“在我们的产品(一款用于 在企业数据中搜索信息的 AI 助手)中,LLM 只是其中一个组成部分。在对 DeepSeek 的精炼模型进行首次测试时,我们遇到了诸如循环生成和 拉脱维亚 whatsapp 数据 语言混合等问题。因此,目前我们使用去年经过验证的模型,这些模型在我们的实施中得到了很好的证明。我们预计,在不久的将来,DeepSeek 或其他开发人员将发布针对本地计算资源(1-2 个视频卡)优化的高质量模型。这对于无法使用云解决方案的企业客户尤其重要,”Vladislav Belyaev 告诉 ComNews 记者。
另请阅读
工业企业实施人工智能解决方案进展缓慢
俄罗斯只有35%的工业企业有在工作流程中实施人工智能(AI)的经验。相当一部分企业员工缺乏足够的技能来运用人工智能。 38%的员工将该水平评为零。
“在我的主观意见中,R1 不如 ChatGPT-o1-pro,而且幻觉出现得更频繁,但为了客观评估模型的质量,应该关注基准,而不是 10-15 个个人示例。根据包括封闭测试在内的测试,DeepSeek-R1 是一个非常强大的模型,绝对是开源解决方案中最酷的,”ANO 人工智能研究所 (AIRI) FusionBrain 实验室可解释 AI 小组负责人 Anton Razzhigaev 表示。
不过,他称 DeepSeek 的走红纯属巧合,其中包括该产品的成功推出时机和大量记者的关注。据他介绍,在不久的将来,我们应该期待开源社区对 DeepSeek-R1 做出大量改进。
PAO Sberbank(开发 Kandinsky 和 GigaChat 神经网络)、PAO T-Bank 和 OOO K2Tech 的新闻服务代表没有回答 ComNews 记者的问题。