家庭作业是不是都可以交给 AI 智能助手了?

缘起单位组织的一次线上法律知识测试,试题包涵单项选择、多项选择和判断题,题目是从题库中随机抽取的,所以每个人的试题都不一样,关键是题目不是机械的知识点阵列,是灵活应用型的,所以难度还是挺大的。

第一次,我采取了常规的用搜索引擎查找答案的方式,用了 Google 和百度,因为是单位的试题,网上也没有现成范例,基本没有直接明了给出答案的。多项选择题更是难答。最后提交答卷,成绩是74分,没有达到80分的合格线。

正在想怎么办时,听到年轻同事说可以用 AI 智能助手——豆包来答,几分钟就轻松搞定,也是一楞:对呀,怎么没想到用 AI 来答题呢?

他们提到的豆包,是字节跳动旗下的 AI 智能助手,和百度的文心一言、OpenAI ChatGPT 、Google Gemini 一样,是一种人工智能技术驱动的自然语言处理工具,可以智能地回答我们的提问,直接给出答案,而不是我们自己在搜索结果中去查找答案。

说干就干,登录豆包网页版(www.doubao.com),将试题的题目连候选答案一起复制进聊天框,豆包光标闪烁了几下,迅速给出了答案,并对各个选项进行了分析。啊,太棒了!我欣喜地把答案填入答题纸。So easy!

咦,多项选择题时,它怎么只给出了一个答案呢?我在聊天框中提醒它:这是道多选题,请重新判断。马上它又给出了不同的答案,符合多项选择的要求。我不禁犯起了嘀咕,说变就变,这靠谱吗?在后面的答案中,还遇到过类似的多项选择只给出一个答案的情况。

当我信心满满地提交答卷,准备拿100分满分时,系统显示只有90分,总共错了4道题,两个给错答案的多项选择题,更改答案后,一对一错。

这样的结果给了我们当头一棒,不要痴迷现在的 AI 智能助手,它们还不是万能的。

想想也是,AI 智能助手的正确率是取决于它们学习的知识库的,主要是网络上已有的内容,说到底仍基于搜索引擎的结果,而这些内容有一定的滞后性。新出的内容,它们没有接触到,存在错误的可能性就更高。

从自己用 AI 智能助手作弊完成考试这件事,我也想到孩子们的学习,真的要禁止他们用这种偷懒的方法,不然看着平时作业完成都很好,到考试时两眼一抹黑啥也不会。


历史上的今天:

相关推荐

AI 生成的作品受不受版权保护?

不知道是否受了春节期间 AI 红包的推动,发现节后上班时许多同事都在用 AI 生成视频,并乐此不疲,创意不断,精品层出。 用得最多的 AI 工具是即梦和豆包,因即梦需要会员,新手尝试的更多是豆包,他们用豆包生成一段段15秒的视频,再用剪映 App 剪辑成一个长视频,视觉效果堪当专业工作室制作,真是很精彩。 就像抖音上 ...

人工智能产生的垃圾正在污染我们的文化

近日《纽约时报》发表神经科学家、小说家埃里克·霍尔(Erik Hoel)的文章指出,AI 生成内容正在污染我们的文化,长此以往,我们引以为傲的灿烂文化将会消失。 越来越多的人工智能生成的合成输出出现在我们的信息流和搜索中。赌注远远超出了我们屏幕上显示的范围。整个文化正在受到人工智能径流的影响,它正在潜入我们最 ...

Google AI vs OpenAI,谁才是当前最强 AI 生态?

2026年开年才两个月,AI 圈已经硝烟四起。 2月19日,Google DeepMind 正式推出 Gemini 3.1 Pro,多项基准测试直接登顶,把推理能力拉到新高度;几乎同期,OpenAI 也发布了 GPT-5.3-Codex 等更新,把编码Agent推向新巅峰。 很多人问:现在到底选 Google 还是 OpenAI ? 今天我们就来一场硬核对比——从核心模型、多模态能 ...

OpenAI 将发布 AI Web 浏览器挑战 Google Chrome

据三位知情人士向路透社透露,OpenAI 即将发布一款人工智能网络浏览器,挑战 Google Chrome 浏览器在市场上占据的主导地位。这款浏览器预计将在未来几周内发布,旨在利用人工智能从根本上改变消费者的网页浏览方式。这将使 OpenAI 能够更直接地获取 Google 成功的基石:用户数据。 如果 ChatGPT 每周有5亿活跃用户采用 O ...

6 条评论

  1. AI 能拿到90分很优秀了

  2. 向 AI 提问也需要自己能发现问题并提出问题能力。

    • @沉沦 搜索的要点在输对关键词,AI 提问的要点是什么呢?
      我是把整个题目给它的,答不对我就怪它还不够智能。呵呵。

  3. 不能迷信ai目前。我搞github ssh才发现。还是各种都得参考。

    • @ACEVS 它只会抄作业,不会原创的。所以底稿错的话,它也就错了。

发表评论

您的电子邮件地址不会被公开,必填项已用*标注。