下午三点,培训准时开始。主讲人是技术部的张工,他手里拿着平板电脑,上面放着各种特殊天气的标注案例。“大家看这张图,”张工指着屏幕上的雪天图片,“路面上的积雪和冰面要分开标注——白色、松软的是‘积雪’,反光、坚硬的是‘冰面’,因为冰面对车辆的摩擦力更小,对自动驾驶的影响更大。”
培训过程中,大家时不时提问。有人问“暴雨天里,行人撑的伞要不要单独标注”,张工回答“伞属于‘行人附属物’,不需要单独标注,但要确保标注框把伞和行人一起框住”;有人问“沙尘暴天气里,看不清的物体怎么处理”,张工说“可以标‘疑似物体’,但要控制比例,不能超过该场景标注总数的5%”。
林夏听得很认真,笔记本上记满了要点。他还拍了很多案例图片,打算培训结束后,结合规范手册再复习一遍。
培训结束后,林夏回到工位,立刻把培训学到的知识用到实际标注中。他打开一张雪天的图片,按照培训内容,先标注出“积雪”“冰面”,再标注行人、车辆。比如一个走在雪地里的行人,他不仅标了“行人”,还在备注里写了“穿着厚重衣物,行走速度较慢”——虽然规范里没要求,但他觉得,这些细节可能对ai理解“行人行为”有帮助。
傍晚六点,林夏接到组长的消息,说有一批紧急的医疗图像标注任务,需要抽调几个人支援。医疗图像标注比普通的图像标注要求更高,比如标注一张ct片,要准确标出病灶的位置、大小,还要区分病灶的类型——“良性结节”“恶性肿瘤”“炎症”等,稍有不慎,就可能影响医生的诊断。
林夏没有犹豫,回复组长“我可以”。他之前参加过公司组织的医疗标注培训,还通过了医疗标注资格考试,有资格处理这类任务。他打开医疗标注系统,先看了眼任务说明:标注肺部ct片中的“磨玻璃结节”,要求标注出结节的位置、直径,并判断结节的“密度类型”(纯磨玻璃、混合磨玻璃)。
林夏深吸一口气,打开第一张ct片。屏幕上,肺部的影像呈现出深浅不一的灰色,磨玻璃结节是淡淡的灰色阴影,比普通的肺部组织颜色稍深,但又比实性结节颜色浅,很容易和炎症、出血等影像混淆。他用标注工具里的“测量”功能,测量结节的直径——3.2毫米,属于“微小结节”;再放大结节的影像,观察密度——结节内部没有明显的实性成分,属于“纯磨玻璃结节”。他按照要求,在标注框里填写了“纯磨玻璃结节,直径3.2mm”,又在备注里写了“位于右肺上叶,边界清晰”。
医疗标注的速度比普通标注慢很多,一张ct片往往要标注十几分钟。林夏专注地盯着屏幕,连晚饭都忘了吃。直到晚上八点,他才标完第一批ct片。他揉了揉眼睛,发现眼里布满了红血丝——长时间看ct片,眼睛的疲劳感比看普通图片更强烈。
他起身去茶水间泡了杯咖啡,回来时,看到工位上放着一份盒饭。邻座的张姐走过来:“我看你一直在忙医疗标注,没去吃饭,就帮你带了一份。快吃吧,凉了就不好吃了。”
林夏心里一暖:“谢谢张姐,又麻烦你了。”
“客气啥,都是同事。”张姐笑了笑,“医疗标注费眼睛,你标一会儿就休息十分钟,别太累了。”
林夏点点头,打开盒饭,里面是番茄炒蛋和青椒肉丝。他一边吃,一边想着这份工作的意义。以前,他觉得数据标注只是一份谋生的工作,每天对着屏幕画框、分类,枯燥又重复。但自从接触了医疗标注,他改变了想法——他标注的每一个病灶,都可能帮助ai更快地识别疾病,让医生的诊断更准确,甚至能帮助患者更早发现病情。有一次,技术部的人说,他们开发的医疗ai系统,用了公司标注的数据集后,对早期肺癌的识别准确率提高了15%,这让林夏觉得,自己的工作很有价值。
吃完晚饭,林夏休息了十分钟,又投入到医疗标注中。他按照张姐说的,每标注半小时,就站起来活动五分钟,看看窗外的夜景,缓解眼睛的疲劳。
晚上十一点,林夏终于完成了支援的医疗标注任务。他提交数据后,收到了审核组的反馈:“标注准确,无错标、漏标,备注详细,符合要求。”看到反馈,他松了口气,紧绷的神经终于放松下来。
他关掉电脑,收拾好东西,走出办公楼。夜里的风很凉,他裹紧了外套,抬头看了看天空——星星很少,但月亮很亮。他掏出手机,给家人打了个电话。
“喂,妈,还没睡啊?”
“没呢,等你电话呢。今天又加班了?”妈妈的声音很温柔。
“嗯,加了个班,不过任务完成了。”林夏笑着说,“你们最近身体怎么样?爸的血压还好吗?”
“挺好的,你爸的血压控制得不错。你在外面要照顾好自己,别总熬夜,按时吃饭。”
“知道了妈,我会注意的。”
挂了电话,林夏加快了脚步。他知道,明天还有新的标注任务在等着他——可能是普通的街景图,可能是复杂的医疗ct片,也可能是需要细致分类的语音数据。但无论是什么任务,他都会保持那份细致和严谨,在像素和数据的世界里,做好ai的“启蒙老师”。
回到公寓,室友已经睡熟了。林夏轻手轻脚地洗漱完,躺在床上。他掏出手机,翻了翻今天的工作记录:普通图像标注180张,医疗ct标注30张,参加培训1次。他笑了笑,虽然累,但很充实。
他闭上眼睛,脑海里闪过今天标注的各种画面——雾天里的公交车、雪地里的行人、ct片上的磨玻璃结节。这些看似零散的像素和数据,正在一点点拼凑出ai的未来。而他,林夏,一个普通的数据标注员,正是这个未来的参与者、推动者。
窗外的月亮透过窗帘的缝隙,洒进一缕微光。林夏知道,明天太阳升起时,他又会坐在电脑前,指尖在鼠标上滑动,为ai标注出一个个准确的框线,也为自己的生活,标注出一步步向前的轨迹。