清晨六点,太阳从恩贡山后升起。
工作站里横七竖八躺满了人。程序员抱着笔记本睡着了,工匠们在角落蜷缩着打盹,鲁智深靠墙坐着,手里还握着半杯冷掉的咖啡。
阿明最后一个倒下。在昏睡前的最后一刻,他点击了“模型训练开始”。服务器开始轰鸣,用过去七小时采集的三百二十七个手工艺视频,训练一个前所未有的ai——它不翻译文字,它翻译动作。
上午十点,鲁智深被惊呼声吵醒。
阿明顶着鸡窝头,眼睛死死盯着屏幕,嘴里喃喃道:“不可能......这不可能......”
屏幕上,是“手势翻译”功能的测试界面。左侧是埃塞俄比亚女人编筐的视频,右侧实时生成简笔画示意图:一根曲线代表藤条,手的图案做出弯曲动作,旁边有个“√”;然后是剥皮动作的示意图;接着是编织步骤的分解图......
而在界面下方,一个进度条在跳动:识别率89%。
“我们只用了七个小时的数据!”阿明激动得声音发颤,“通常这种多模态模型需要几百万条标注数据!但这三百多个视频......质量太高了!每个动作都干净、标准、充满信息量!这些工匠,他们二十年的肌肉记忆,每一个动作都是教科书级别!”
鲁智深走到埃塞俄比亚女人身边。她醒着,正对着手机屏幕发呆——屏幕上在播放伊朗老人画细密画的视频,而视频下方,ai自动生成了示意图:笔的倾斜角度,手腕的施力点,呼吸的节奏......
女人指着屏幕上老人握笔的手,又看看自己的手,说了句阿姆哈拉语。
翻译揉着惺忪睡眼:“她说......这个老人的手,和她的手一样老,一样聪明。”
上午十一点,平台新版本上线。
“手势翻译”功能被放在首页最醒目的位置。图标是两只握在一起的手,一只是深色皮肤布满老茧,一只是浅色皮肤沾着颜料。
第一个使用者是埃塞俄比亚女人。她在平台上找到了一个土耳其地毯编织匠的视频,虽然语言不通,但她看懂了示意图里“打结”的动作。她点击“联系工匠”,用阿明临时开发的“手势消息”功能——手机前置摄像头捕捉她的手势,ai翻译成示意图,发送给对方。
三分钟后,土耳其工匠回复了。也是一段手势视频:他展示了一种更快的打结方法,手势示意图显示效率提升30%。
两个语言不通、相隔三千公里、从未谋面的人,完成了第一次“手艺对话”。
上午十一点半,数据爆炸了。
来自十七个国家的工匠,开始疯狂上传自己的制作视频。伊朗细密画师上传调色过程,西班牙锻造师上传淬火技巧,越南竹编匠上传劈篾手法......而ai像一块贪婪的海绵,吸收着这些人类千年积累的手部智慧。
阿明盯着后台的实时学习曲线,声音发飘:“鲁总,这个模型......它在进化。每多一个视频,识别率就上升一点。而且它开始自己总结‘元技能’了——你看,它发现编筐、竹编、织布,都有类似的‘经纬交错’模式。它发现细密画、锻造、木雕,都有‘渐进叠加’的模式......”
鲁智深看向窗外。阳光刺眼,排队的人群依然很长,但每个人的脸上不再是焦急,而是一种奇特的期待。他们捧着手机,看屏幕上来自世界另一端的手,在做着和自己相似又不同的动作。
一个马赛族青年突然跳起来,用斯瓦希里语大喊:“他!那个印度人!他染布时控制温度的方法,可以改良我们的珠子烧制!”
翻译还没来得及说话,鲁智深已经听懂了。
因为那青年眼里闪着的光,和当年少林寺师兄弟破解一套新拳法时的光,一模一样。那是一种跨越语言、跨越文化、跨越一切障碍的,属于“手艺”本身的狂喜。
手机震动,西蒙发来消息:“鲁总,bbc想把纪录片扩展到三集。他们想派团队来,拍摄这个‘手势翻译’如何让世界手艺人对话。可以吗?”
鲁智深回复:“可以。但有个条件——每集片头,都要打上一行字:本片献给所有用手思考的人。”
他放下手机,走到工作站中央。那里挂着一块白板,上面是昨晚画的圆圈。他在圆圈中心,画了一只张开的手。
然后,他在旁边用中文写了一行字:
“手有记忆,心能相通。”
三百多双手的手语,正在被ai翻译成一种新的世界语。
一种不需要单词,只需要看手怎么动的语言。