时间:2023-03-21|浏览:283
OpenAI 官宣 GPT-4 引起轩然大波,比前身更受欢迎 GPT-3.5 更可靠,更有创意。GPT-4 可接受图像和文本输入,然后输出正确的文本回复,是一种大型多模态模型。实验表明,GPT-4 在各种专业测试和学术基准方面的表现与人类水平相当。例如,它通过了模拟律师考试,分数在考生面前 10% 左右;相比之下,GPT-3.5 得分倒数 10% 左右。
大型语言模型的子弹不断飞行,ChatGPT 职业“威胁论”也成为热议的焦点。例如,INSIDER 准备一份被子 AI 取代风险最高的工作清单,技术工作(编码员、计算机程序员、软件工程师、数据分析师)、媒体工作(广告、内容创作、技术写作、新闻)、法律行业工作(律师助理、法律助理)、市场研究分析师、教师、财务职位(财务分析师、个人财务顾问)、贸易商、平面设计师、会计师和客户服务代理。
昨天,一篇由 OpenAI、OpenResearch 与宾夕法尼亚大学学者合作的论文发表在预印本网站上 arXiv 以科学的方式进行研究 GPT 会对劳动力市场产生怎样的影响?本研究采用了一种新的评估方法,即根据职业和职业 GPT 结合人类专业知识和能力的对应性来评价职业 GPT-4 从而讨论分类 GPT 可能对劳动力市场产生影响。
为了理解 LLM 本研究应用的两个评价标准是:直接暴露的能力及其对工作的潜在影响(exposure),即 GPT 可以直接完成或帮助完成的任务;间接暴露,即通过 GPT 帮助完成支持软件和数字工具的任务。
研究发现,大多数职业在一定程度上表现出来 GPT 暴露,大约 80% 至少可能有美国劳动力 10% 将完成工作任务 GPT 影响,大约 19% 至少可能有工人 50% 任务受到影响。这种影响涵盖了所有的工资水平,高收入工作可能面临更大的风险。
严重依赖科学和批判性思维技能的角色 GPT 编程和写作技巧与暴露呈负相关 GPT 暴露是正相关的。在工作中面临更高(更低)壁垒的工人往往会经历更多(更少)。 GPT 暴露。信息处理行业暴露程度高,而制造业、农业和矿业暴露程度低。
生产力的增长和过去十年的总体增长 GPT 暴露之间的联系似乎很弱,这表明未来大型语言模型生产力的增长可能不会加剧可能的“成本疾病”效应,这是一种潜在的乐观情况。
GPT就是GPT
GPT 三个符合一般目的技术的核心标准:随着时间的推移,它们正在即兴发挥能力,能够完成或帮助一组越来越复杂的任务和用例;GPT 它本身可以对整个经济产生普遍影响;同时,GPT 互补创新,特别是通过软件和数字工具,可以广泛应用于经济活动中。
决定大型语言模型有效性的关键因素是人类对它们的信任和习惯。例如,在法律界,模型的有用性取决于法律专业人员是否可以信任其输出,而无需核实原始文件或进行独立研究。技术的成本和灵活性、员工和公司的偏好以及激励措施也在基于大型语言模型的工具中发挥着重要作用。
此外,由于数据可用性、监管质量、创新文化、权力和利益分配等因素,大型语言模型在不同经济部门的应用也会有所不同。因此,如果我们想充分了解员工和公司对大型语言模型的使用,我们需要更深入地探索这些复杂的问题。一种可能性是,节省时间和无缝应用比提高质量更重要。
总的来说,尽管 GPT 提高人类劳动效率的技术能力是显而易见的,但重要的是要认识到,社会、经济、监管等因素可能会影响实际的劳动生产率。随着能力的不断发展,GPT 对经济的影响可能会继续和增加,这挑战了政策制定者对其发展轨迹的预测和监督。