人工智能可能在创造性思维任务上胜过大多数人类_人类与科技

发表在《科学报告》(Scientific Reports)上的一项研究表明，大型语言模型(LLM)人工智能聊天机器人在创造性思维任务上的表现可能会超过普通人，在这种任务中，参与者需要设计出日常物品的替代用途(这是发散思维的一个例子)。然而，得分最高的人类参与者的表现仍然优于聊天机器人的最佳反应。

发散性思维是一种思维过程，通常与创造力有关，涉及为特定任务产生许多不同的想法或解决方案。它通常是用替代用途任务(AUT)来评估的，在这个任务中，参与者被要求在短时间内想出尽可能多的日常物品的替代用途。回答分为四个不同的类别:流畅性、灵活性、独创性和阐述。

Mika Koivisto和Simone Grassini比较了256名人类参与者与三个人工智能聊天机器人(ChatGPT3、ChatGPT4和Copy.Ai)对四种物品(绳子、盒子、铅笔和蜡烛)的反应。作者通过对答案的语义距离(回答与物体的原始用途的密切程度)和创造力进行评级，来评估答案的原创性。使用计算方法在0到2的范围内量化语义距离，而人类评估者对回答的发起者视而不见，主观地将创造力从1到5打分。平均而言，聊天机器人生成的回答在语义距离(0.95 vs 0.91)和创造力(2.91 vs 2.47)方面的得分明显高于人类的回答。在这两项测试中，人类的反应范围都要大得多——最低得分远低于人工智能的反应，但最高得分通常更高。在8个得分类别中，人类的最佳反应在7个类别中超过了每个聊天机器人的最佳反应。

这些发现表明，人工智能聊天机器人现在至少可以像普通人一样产生创造性的想法。然而，作者指出，他们只考虑了与创造力评估相关的单一任务的表现。作者提出，未来的研究可以探索如何将人工智能整合到创造过程中，以提高人类的表现。