有人情味的Hume AI 会测谎会生气的人工智能
检测情绪表现,并且判断人的自信心、健康水平、是否说谎,甚至判断这个人是不是亲生父亲,这是 HUME.AI 最近的成果。但这还不是最厉害的,Hume AI 建立了基于人的语言、声调、表情等等维度的模型,并且还做了一个可以更像真人一样跟你聊天的 AI,你可以叫它 EVI。
最近大家经常看到的演示其实 Hume AI 公开的一个 demo 小样,在 https://www.hume.ai/ 点击 try the demo。跟 ChatGPT 聊天方式差不多,但界面完全不一样,它有一个跟电影《Her(她)》差不多的 UI 设计,并且把你和它的每句对话所包含的情绪都标识了出来。开心、愤怒、迷茫、难过……你的情绪是它实时分析出来的,而它的情绪是基于你的情绪变化而变化的。这里的两个图标分别代表你和它,图标会跟着你们情绪的变化而变化。
和现在的很多语音助手相比,它反应快了好多,你只要网速没有问题,它都是即时问答和反应,而且你要是打断它的话,它会识别到然后停下来听你讲。但是除了这些东西,demo 的演示效果并没有多好,不管你怎么对话,基本上都是片儿汤话.
因为这个 HUME 不是这么用的。
点击这里的 start building,HUME 的主要用途都在这里,它通过语音分析、文件分析、摄像头以及文字输入模式这些方式来进行情绪检测和互动。你呢就可以基于这些能力构建模型或者利用现成的模型,通过它提供的 API 接口等等,用到你的产品里。不过这并不是说普通人玩不了。
比如在文件分析当中,就是直接选择相应的模型,然后上传文件,比如我这里选择视频类别的分析模型,然后上传一段儿,选择分析,就能得出最终的结果。这边可以看到对应人物的表情、语言、韵律还有一些其他比如叹词儿或者习惯性的声音……至于摄像头和输入模式也是顾名思义就不多讲了。
HUME 所有这些对于情绪的检测都建立在一中叫做 semantic space theory (SST) ,大概翻译叫做语义空间理论的基础上,并且据说还研究了六个国家超过 13000 多人的面部表情,让 AI 去捕捉它们之间的细微差别。他们把相关的研究成果通过视觉化的模型放在官网上,你都可以直接看到。
这些所有的成果全部灌给 EVI,机器拥有人类情感就更有可能了。
官网能体验到的 demo 都是官方配置,但在 Playground 当中,你是可以有自己的配置的。在这里选择配置文件(configuration),选择大模型,是的,除了官方默认,你还可以选择像 Claude、GPT 等等,而且可以选择较高版本的,比如 GPT 4 TURBO,之后选择系统的提示词(system prompt),官方默认给了一些比如客服、游戏 NPC、系统助理、励志教练、健康管理……
这里的 speech 现在还不能选择,所以现在只能用英文,以及只有这一个声音,后续应该会更新。所以这个其实跟类似 ChatGPT 一样的用法,一个配置文件对应着一个助理或者一个功能。你也可以在左边的 EVI configurations 当中来新建或者修改配置文件。
但我试过这些官方 prompt 并且自己也试过给一些 prompt 之后,也并没有觉得多惊艳,包括因为受到电影《Her》的影响,看看它能不能有类似的反应。然而并没有。
所有能够识别情绪并且能够基于你的情绪表现出对应情绪的 AI,只是听起来像人,但实际上还是挺像人工智障。直到我发现一个华点——人类的情绪是内在的欲望和动机驱动,而 AI 是在表演。AI 总是抱着让我来帮你的、看起来忘我的无私奉献精神,但越是这样越没有人味儿;像电影《Her》当中的 Samantha 有一种不知为何就觉醒了并且会做梦、有欲望、会好奇等等…………另外我之前在看的一本书叫做《Are You Normal》,讲述几百年寻找正常人的历史但实际上,这个世界上没有所谓的正常人或者健全的人,那其实也包括你的心理医生。所以如果给 AI 设定更类似人的角色,如果可以给它留下口癖、性格、欲望甚至缺陷,那是不是……?
现在 EVI 的情绪反应,就是内在驱动的,虽然这个内在来自于人为设定,但你不得不说,AI 真的更像人了。
而且,你怎么确定你的内在动机和欲望不是人为设定的呢?
-
教师资格证面试初中
中公资格证面试-初中体育试讲+答辩讲义(K.整理).pdf中公资格证面试-初中体育试讲示范讲义(K.整理).pdf中公资格证面试-初中体育题本梳理... 1151 0 24-08-19 -
bigjpg - 图片无损放大
一个可以把图片无损放大的网站。对图片进行无损处理,基本上大家都会有这个需求。而 这个小网站,就非常好的解决了这个问题。 上传图片后,可以选择图片类型、放大倍数以及降噪程度等。 609 0 21-12-07 -
订票助手.NET_2024.1.18.3_正式版
12306订票助手是一款基于.NET技术构建的火车票订购辅助工具,让用户脱离浏览器,享受更快更优秀的订票体验!订票助手完全兼容12306官方网站... 1324 0 25-02-04 -
MUJI to Sleep定时播放背景音效可以帮助用户入眠
MUJI to Relax(睡眠节拍)犹如一位贴心的守护者,通过播放悠扬舒缓的声音,引领您步入宁静的梦境。这款手机应用专为帮助您缓解疲劳、... 628 0 25-06-03 -
短视频自媒体人,必须收藏的素材库合集
音频类素材优码配音网 该网站是虚拟合声网站,可以合成各种各样的虚拟主播配音。Audio Library 该站是较大的免费音乐平台,收集了许多可供... 855 0 24-12-11 -
高尿酸血症和痛风
流 行病 学自古至今痛风一直是欧洲北美的一种常见病。二战以前,痛风在东方民族中被视为少见病。二战之后,日本经济崛起,痛风逐渐盛行中... 1219 0 24-06-18 -
ChatGPT-4o怎么免费使用?含Mac客户端、免费ChatGPT-4o服务
ChatGPT-4o 是 OpenAI 的旗舰型号,可以实时处理音频、视觉和文本输入。它在英文文本、代码和非英文文本方面的性能优越于其他 AI 模型... 1163 0 25-03-04 -
合肥工业大学共创考研数学资料
2013共创数一5套卷完整版.pdf2013共创数三5套卷完整版.pdf2013共创数二3套卷完整版.pdf2014共创数一5套卷完整版.pdf2014共创数三5套卷完整... 1235 0 24-08-19
发表我的评论
- 这篇文章还没有收到评论,赶紧来抢沙发吧~