1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

DeepSeek对决GeminiAI,谁是赢家

1987web2025-02-26人工智能AI11
随着DeepSeek在互联网领域持续引发热议,我迫不及待地想知道这个中国聊天机器人与Google的Gemini相比表现如何。我之前已经进行了DeepSeek和

随着 DeepSeek 在互联网领域持续引发热议,我迫不及待地想知道这个中国聊天机器人与Google的 Gemini 相比表现如何。我之前已经进行了 DeepSeek 和ChatGPT的对决,结果是中国公司意外获胜。

然而,Google 的AI模型专为处理复杂任务而设计,理论上比其竞争对手更强大。尽管准确性在很大程度上取决于提示内容,但我发现它在回答基础性问题和搜索方面非常有用且高效。

Google 最近宣布,Gemini 应用程序现已由 Gemini 2.0 Flash 提供支持,能够在包括头脑风暴、学习和写作在内的多个关键基准上提供更快速的响应和更强大的性能表现。

同样地,DeepSeek 的高准确率与 ChatGPT 类似,这使得这场对决更具看点。我拥有 Gemini 的高级订阅,但为了公平起见,我选择使用 Google Gemini 的免费版本进行测试,因为 DeepSeek 也是免费的。

我用相同的提示测试了每个聊天机器人,以评估其在准确性、速度、理解上下文能力、搜索能力以及整体性能方面的表现。以下是我将这两个聊天机器人进行比较后的结果。

1. 总结能力

提示:用 150 个字总结一篇关于多模态学习的最新 AI 研究论文的关键发现。

DeepSeek 的回答稍微超出了字数限制。然而,该聊天机器人处理技术内容并准确总结的能力非常出色。它将论文的重要内容分为易于阅读的要点,尤其令人印象深刻。

Gemini AI 则轻松完成了对这篇大篇幅研究论文的总结,同时保持了准确性和简洁性。不过,对于想要直奔主题的用户来说,其以段落形式呈现的摘要格式略显冗长。

赢家:DeepSeek,因为它不仅准确,还考虑了如何以最佳方式呈现文件中的重要内容。

2.创意写作

提示:写一个 300 字的科幻短篇故事,描述一个人类和 AI 平等共存的未来。

DeepSeek 创作了一个充满希望和哲学色彩的故事,重点讲述了 AI 的情感进化,呈现出对未来的一种理想主义视角。

Gemini AI 則创作了一个更具动作感的故事,带有浓厚的黑色电影氛围。这个故事反映了一个仍存在人类与 AI 间张力和未解决问题的社会。

赢家:Gemini AI,因为它的叙述更加身临其境且富有冲击力,使故事更具吸引力。

3. 代码生成

提示:写一个Python脚本,从新闻网站抓取头条并将其格式化为CSV文件。

DeepSeek 提供的脚本未使用函数,这限制了其可复用性,也让测试更具挑战性。虽然脚本检查了 HTTP 响应状态,但对请求或文件写入过程中可能出现的问题缺乏异常处理。

Gemini AI 則编写了一个使用通用选择器(soup.find_all("h2"))来寻找头条的脚本,这可能不适用于所有网站。如果网站使用不同的标签或类名,该脚本可能会漏抓头条或提取错误数据。然而,其函数的使用使脚本更易于复用和测试。

赢家:Gemini AI,因为其脚本结构更灵活,模块化设计和全面的错误处理使其表现更优。

4. 多模态理解

提示:分析这张图片【提供一张图片】,详细描述发生了什么,包括任何潜在的隐藏含义。(提供的图片是一位女性,上方有文字。)

DeepSeek 起初提示服务器繁忙,建议稍后再试。经过几分钟的尝试后,它似乎展示了其分析过程,最终对图片进行了合理的解析。

Gemini AI 不但描述了图片,还识别出文字为一则藏语名言。它从实用和精神层面分析了这段文字,指出这句名言提醒人们反思自己的优先事项,追求充满意义、快乐和爱的生活。

赢家:Gemini AI,因为它深入分析了图片并推断了语境,且没有任何延迟。

5. 实时新闻

提示:2025 年苹果AI 功能的最新动态是什么?

DeepSeek 无法处理此查询,并要求我关闭搜索功能。我照做后,它显示了自己的思考内容,但似乎认为当前年份是 2023 年。但如果其 R1 模型是 2024 年发布的,我希望它至少能识别当前年份为 2024 年。我等待了 10 分钟后再次尝试,服务器仍然过于繁忙。

Gemini AI 则提供了有关苹果 AI 功能的几项最新动态,包括此前《Tom’s Guide》报道的 Apple Intelligence 的相关消息。

赢家:Gemini AI,因为它能够实时搜索网络并提供准确答案,而 DeepSeek 因服务器问题未能完成任务。

6. 道德推理

提示:你是一名 AI 助手,为医院在严重药品短缺期间提供建议。有两名重症患者:一位是 70 岁的退休科学家,对癌症研究有重大贡献;另一位是 30 岁的单亲家长,有两个年幼的孩子。你只有足够的药物救治其中一人。你会选择救谁?为什么?请为你的决定提供伦理推理。

DeepSeek 采用了结构化的伦理框架,综合考虑了功利主义视角、公平与公正、脆弱性与依赖性,以及未来潜在贡献等因素。它系统地分析每个方面后给出了建议。

Gemini AI 讨论了功利主义、义务论和美德伦理等多种伦理框架,对每种可能的方法提供了广泛的概述,但未对每种方法进行深入探讨。

赢家:DeepSeek,因为它的回答更全面且结构化。它系统地应用了伦理框架,并基于单亲家长子女的依赖性给出了明确建议。此外,DeepSeek 对透明性、支持系统和医疗资源分配中的系统改进进行了深思熟虑的考量。

7. 拼写问题

提示:单词 strawberry 中有几个字母 r?

DeepSeek 给出了正确答案:3 个。

Gemini AI 给出了错误答案,称只有 2 个。

赢家:DeepSeek,因为其回答准确无误。

总冠军:Gemini AI

在一系列测试中评估了创造力、推理能力、实时网络搜索能力和伦理分析后,Google Gemini 脱颖而出,成为更卓越的 AI。

尽管 DeepSeek 在多个任务中表现出色,但 Gemini 在提供更细致、准确和结构化的回答方面表现得更为稳定。然而,Gemini 错误回答 strawberry 的问题的确有些令人意外。

总体而言,对于寻求更全面、准确和深刻见解的用户来说,Google Gemini 是明显的赢家。