“咔嚓”、“咔嚓”……在山东省日照市大学城园区的数据标注基地里,数百名年轻人坐在屏幕前,动动指尖,熟练地画出图像帧、分割音频、逐帧标记视频。每次点击都会“馈送”一个人工智能模型来了解世界。 AI能否准确识别路况、理解方言、从医学图像中捕捉伤情,都与这些看似基础的任务密切相关。从数据注释器到港口、工厂、医院的智能场景,一条数据驱动的生产力新链条正在山东明显兴起。数据注释行业正在蓬勃发展。什么是数字注释?数据标注是人工智能开发的核心基础之一。数据标注行业是对数据进行检测、清洗、分类、标注、标注、质检等处理的新兴行业。随着人工智能技术的快速发展,数据标注作为人工智能训练和应用的关键环节,提供了前所未有的发展机遇。 “很多人认为标注数据是一项非常简单的工作,但实际上,它是人工智能产业链密不可分的基础。我们处理的每一组数据都是大规模模型决策的基础。”山东水利职业学院学生李建豪是日照市数据标注基础内容标注部分首席实习生。如今,他已经从一个“得分新秀”成长为一个能带队的“小高手”。还记得刚到公园时,常常有“三个项目等待得分手”。变化发生在两年内。目前,基地创造就业岗位3000个,人才储备5000人。吸引了抖音、京东、百度、阿里巴巴、海尔等20余家企业(项目)入驻,形成覆盖全数据服务链的产业集群。该业务还使用基本图像和文本。正在从最初的标注快速扩展到自动驾驶、人工智能教育、大规模工业模型等高价值领域。这并非特例。在山东省,数据标注产业初步形成“核心城市带动的多城市特色发展”格局。济南、青岛、日照等城市年均数据处理量超过100亿条,数据标注产业正在加速向高端领域转型升级。数据重构传统产业 数据标注被认为是人工智能的“基础产业”。目前,数据标注行业正在向垂直细分、嵌入式智能、思维链化三个方向和维度发展。在日照港,“高质量数据集与智能“智能聚合多场景应用”正在改变长期以来的运行模式。聚合过程准确标注了大规模监控视频中各种天气、光线、角度的聚合图像,形成了3.5TB的高质量数据,成为人工智能的“火眼”。目前,系统自动识别率已达到95%以上,下载过程的聚合步骤从30秒缩短到3秒,节省成本超过1800万元在医疗保健领域,高质量的数据集也成为克服行业瓶颈的核心驱动力,数据集支持AI智能设计软件,将单个假肢的设计时间从1至2小时缩短至3至5分钟,这种数据集成成为家用植入机器人的“智能大脑”。为手术规划提供精准支持,监测种植体错位在0.5毫米以内,并发症发生率降低30%,复杂病例成功率提高20%。该机器人将填补国内智能精量种植装备的空白,打破国外技术垄断,为行业数字化转型注入力量。清华大学计算社会科学与国家治理实验室研究员张英强表示:“钢铁、港口等时尚产业为日照数据标注产业的发展提供了良好的基础。技术将朝着专业化、知识化、智能化的方向发展。”产学融合代码“城市+大学”产业的进步离不开人力资源的支撑,山东是一个受教育程度较高的省份。如何将人才优势转化为产业成功?日照市探索的“城市+大学”产教深度融合模式,以“课程联合研究、专业共建、项目联合孵化、草根合作”为基础,在行业内首次打造了“共办”产教融合人工智能数据标注“四种模式”,打破了学校与企业之间的资源壁垒,让教育链与产业链首次实现精准耦合。“真正的产教融合不是简单地送学生” “去企业实习,而是将企业的实际项目、技术标准、管理流程深度融入到整个人才培养过程中。”山东仲恺数字科技集团董事长郭光超深受感动。集团作为日照大学城园区数据标注基地的主要运营者,将企业技术标准划分为在128个教育模块中开展数据采集、数据标注、数字化建模、标注复习等课程,并与省内外40余所高校联合举办“数据标注订单班”,让学生在学习期间接触到行业前沿的标注规范和技术要求。山东省作为国家数据要素综合试验区,高度重视打造优质数据集、发展数据标注产业。近年来,“1+N”人工智能高质量发展政策体系初步建立。国家和地方持续扩大财税支持,重点打造90个行业优质数据集,重点关注工业制造、医疗健康、海洋经济、农业农业等利润丰厚的行业。 智能金融领域,应对数据标签竞争针对企业“资产短、房贷难”的担忧,日照银行创新推出全国首个“数据标签贷”产品,根据企业订单和业务数据提供信用贷款,为众多企业注入金融活力。 (大众记者戴悦、吕乐、实习生董泽正)