AI 硬件的风从年头吹到年尾,许多令人眼花缭乱的产品最终都被市场所淘汰,它们要么是需求并不存在,要么是体验并未改善。相比之下,独立录音设备(如录音笔)的需求却一直很稳定,商务和媒体人士一直是这类产品的核心用户群体。尤其是随着大模型的普及,AI 录音迅速解决了目标用户对“录音后”的语音转写、录音总结、关键信息提取等需求。
因此,也就不难理解,为何一款能贴在 iPhone 背面的“AI 卡片录音机”今年上半年一经推出就引发了广泛关注。不久后,初创公司 PLAUD.AI 又迅速推出了另一款可穿戴设计的“AI 米粒录音机”——PLAUD NotePin(以下简称“NotePin”),意图继续引领 AI 录音设备的潮流。
图/雷科技
然而,当 AI 手机、AI 眼镜以及 AI 耳机等随身设备都开始广泛支持 AI 录音功能时,我们真的还需要一台单独的 AI 录音机吗?在海淘并使用 NotePin 一段时间后,小雷有了一些新的看法。
一个“米粒”,四种佩戴模式
和之前卡片式的 PLAUD Note 一样,NotePin 的功能非常单一,实际上就是“录音”。其主体设计也相当简单,看起来就像没有屏幕的“米粒”——就像过去小米手环的主体设计。正面除了 PLAUD 的 Logo 下隐藏了一个红色指示灯,还有一个收音孔用来收音。不过实际上,在指示灯与收音孔中间,还有压力感应区,这是启动和停止录音的唯一交互方式(在手机 APP 之外)。
作为可穿戴产品,NotePin 一共有四种形态,但除了挂坠形态依赖顶部的挂绳设计,NotePin 的穿戴设计实质上都是以“磁吸”为基础进行设计。包括在手环形态下——看上去基本就是无屏小米手环,手环的表带都是依靠磁吸而非孔洞进行固定。此外,NotePin 也能通过磁吸配件变成背夹形态,夹在衣服上,或者通过背夹磁吸模块吸附在衣服上。
图/雷科技
包括在充电设计上,采用触点充电方式的同时,充电底座加入了磁吸,好处是不太担心没对准,或是不小心触碰而导致没充上电。有一说一,NotePin 主体以及配件的磁吸力度都足够大,正常蹦跳不会影响磁吸的稳定性,但又不至于真的夹伤手指。
另一方面,磁吸设计也让 NotePin 在不同形态之间的切换更为方便,唯一比较费劲也就是手环形态的拆装,由于包裹主体的部分采用硬塑料的材料,而非过去小米手环采用的软塑胶,实际拆装需要一定的蛮力。
但真正使用起来,NotePin 到底如何,可能是大家最关心的。
被交互劝退,录音质量糟糕
如果说初上手,NotePin 给小雷留下的更多是“简约但不简单的设计”。但真正开始使用,首先就感受到了两个字:难用。
前文就提到了,NotePin 主体的唯一功能就是录音,而启动和停止录音的核心交互就是按压正面中间的感应区:按下一次,机身震动,同时红色指示灯亮起,意味着开始录音;再按一次,机身震动,红色指示灯熄灭,意味着录音停止。
坦白讲,这个交互在逻辑上没有问题,但俗话说“魔鬼藏在细节里”。首先是按压需要的力度远超预想,小雷也是各种尝试才发现必须用力重压才能触发启动,但即便如此,仍然有一定概率不会触发。可以推想,NotePin 的产品团队初衷大概为了避免误启动,才把按压触发的力度阈值提高。但最后做出来的效果实在很难令人满意,需要拇指非常使劲才能启动或者停止录音。
而且不仅没有给予用户调节力度的选项,NotePin 在官网、APP 以及产品说明书上,也都没有提醒和引导用户注意这一点。实在不如放弃外观设计上的简约,采用物理按键设计。
另外还有反馈延迟。重按之后 NotePin 往往需要一会儿才能出现反馈(震动和指示灯),延迟可能接近甚至超过 1s,对于按压反馈来说很难接受。
而 NotePin 在交互设计上的粗糙,还体现在电量提示上。众所周知,电量提醒对于可穿戴设备,尤其是无屏设备非常关键。在设计上,晃动 NotePin 会亮起正面指示灯,如果是白色意味着电量还算充足,紫色则意味着设备已经进入低电量。但实际上,这个设计更多只是针对手环形态。小雷实测发现只有纵轴方向上的晃动,才能触发电量提醒,手环形态下自然转动手腕就能做到,但其他形态做起来就相当不自然。
至于录音表现上,不出意料,NotePin 不管在硬件还是算法上都很难和旗舰手机(vivo X100 标准版)相比。尤其在相对嘈杂环境下,比如路口和餐馆,并不能相对清晰地录下人声,同时消噪表现也比较一般。总而言之,NotePin 还是更适合比较安静的室内场景,比如会议室开会或者在家中,远达不到官网宣传的“随时准备捕捉一切”。
“GPT-4o”也救不了 NotePin
和很多今年的 AI 硬件一样,NotePin 虽然只有一个录音功能,但实际上更多的功能还在“后端”——APP 和云上。简单来说,在 NotePin 上完成录音之后,录音文件会暂时存储在机身的存储芯片上,手机打开 PLAUD APP 后会自动同步录音文件,然后就可以利用云端的大模型进行转写、总结以及思维导图的生成。
而 NotePin 的一大宣传卖点就是号称采用 OpenAI GPT-4o 模型,作为 Stater(初始)会员每月将有 300 分钟的转写时长,如果不够就要花费每月 6.58 美元(每年 79 美元)升级 Pro 会员,可以享受每月 1200 分钟的转写时长。
但不管是不是 GPT-4o,最终生成的转写结果实在差强人意,不仅录音中大段的对话被直接忽略,面对中英文夹杂、相对专业的数码科技词汇(比如 Meta Orion、雷电 5)等方面的挑战也很一般。
同样一段录音,小雷也尝试通过 OpenAI 最新的语音转录模型 Whisper Large V3(Hugging Face 在线体验)以及阿里通义的音频转文字功能进行转录,虽然受限于 NotePin 的原始录音质量也有不少问题,但至少在遗漏、准确性方面都明显好过在 PLAUD APP 上的转录结果:而且都免费。
坦白讲,到这里小雷已经看不懂 NotePin 的价值何在,录音交互难用,录音效果也一般,甚至全文转写的结果也难堪大任。到头来,NotePin 唯一的价值可能就是把录音同步到 APP 里。
当然这也建立在不错的待机和录音续航上,官方标称是可以连续录音 20 小时,至少小雷实测连续录音 12 小时绰绰有余,完全可以满足高强度录音后的集中同步。
即便如此,小雷也不会向任何人推荐 NotePin。对绝大部分用户而言,今天的手机已经能够满足大部分的录音需求,没有必要单独配置录音设备。而对专业用户来说,尽管可穿戴+磁吸配件的设计让 NotePin 变得更加灵活和容易触达,但糟糕的交互体验、一般的录音表现和模型转写效果,也很难满足这部分用户的实际需求。
基础体验不好,AI就是裸泳
过去将近一年的时间里,各种 AI 硬件可以说层出不穷,但时至今日其实也只有 AI 眼镜获得比较广泛的认可,尤其是 Ray-Ban Meta 这款产品带来的范式。在之前的报道中雷科技就多次提到,AI 眼镜是“先眼镜后 AI”。与眼镜、耳机相较,传统录音机是一个典型的利基市场(小众市场),有相对明确的用户群体以及较为小众的专业需求,也有更高的录音要求。而就目前来说,大模型带来的改变集中在“录音后”的阶段,省去了太多转写、总结、提取相关信息的繁杂工作。
反过来,这其实也更加要求硬件厂商要重视用户的基础体验以及录音质量,先做好一台录音机,才能做好一台 AI 录音机。推而广之,AI 硬件或许都存在这样一种准绳:在已有产品形态上进行 AI 化,不是单纯以大模型为核心构建产品,而是从传统形态出发找到用户的根本需求,在充分借鉴传统形态(与解决方案)的同时,思考大模型技术能够在功能、交互上带来的扩展和进步。