短视频,自媒体,达人种草一站服务
每每提到“AI开发者”,大多数人想到的可能是来自互联网大厂的“程序猿”们,他们身居算法工程师、数据工程师等高光岗位,有着名校博士乃至博士后的傲人学历,并且拿着动辄百万的年薪。
正如大家所看到的,人工智能的第三次浪潮已经持续了一段时间,逐渐从象牙塔走进了社会的角角落落。可在大多数人的认知里,AI仍然有着相当远的距离,仍然是部分高知分子研究的产物,仍然是一本普通人触碰不到的“天书”。
但现实中正在发生的一些事情,俨然超出了我们的预想。
埃隆·马斯克为特斯拉招聘AI人才时曾直言:“博士学位绝对不是必需的,我不在乎你是否高中毕业。”不同于许多人对学历和经历的痴迷,马斯克正在寻找那些对人工智能有“深刻理解”的人。
不只是特斯拉的不拘一格,在游离于大多数人视线外的赛场上,一群20岁上下的少年刚刚经历了一场在AI世界的“奇幻漂流”,诠释着他们对人工智能的理解。
01 像看地图一样看新闻
正在读大四的罗运是武汉大学地理信息科学专业的本科生,他与AI的机缘开始于年初的新冠疫情。
寒假回到家乡的罗运,刚刚过了几天可以赖床的生活,就被班级群里的讨论绷紧了神经。原来在他们离校几天后,武汉就因为新冠疫情封了城。罗运想要了解那座熟悉的城市到底发生了什么,努力在社交媒体和资讯平台上搜索一切和武汉相关的新闻,却发现网上充斥着太多的谣言和假消息,想要进一步查找学校周边的情况,只能在社交媒体上找到寥寥几条无法确证的内容。
由于地理信息科学属于计算机和地理的交叉学科,除了和地理有关的课程,罗运还自学了计算机编程,并且经常在国外的慕课平台上看一些人工智能的课程和案例。苦于查找武汉当地新闻的罗运萌生了一个大胆的想法:能不能将地图和新闻资讯进行结合,像看地图一样查看当地的新闻?
罗运将自己的想法和参加大学生创新创业比赛时的两个小伙伴进行了沟通,三人一拍即合,决定打造一款以地图为导向的时空新闻交互网页应用。
团队首先确认了他们想要抓取的比较权威且有公信度的新闻源网站,然后使用Scrapy异步爬虫框架对新闻进行智能提取,在百度飞桨提供的深度学习框架的支持下,基于文心ERNIE进行命名实体识别,再联合百度地图等的地理编码服务,利用PostGIS计算空间数据的尺度、跨度,进行分词和词性提取后,运用TF-IDF、LDA等算法进行文本的向量化、词频分析、主题分析、相似度分析,最后采用飞桨的GRU4Rec模型根据用户行为序列与兴趣区域推荐新闻。
经过四个多月的开发测试后,将地图和新闻结合的网页应用正式上线。当罗运将鼠标点向武昌火车站的时候,网页上弹出了长江网的最新消息,内容是武汉市解除离汉离鄂通道管控,涉及武昌站、武汉站、汉口站等火车站。看着自己的成果,罗运比任何一刻都更想念这熟悉的城市、熟悉的学校。
不善言谈的他,很快和小伙伴定好了下一步的目标:目前他们正在为这款应用添加新的功能,逐步增加情感趋势面分析、舆论导向分析等功能,方便普通用户在地图上找到不同时段新闻的同时,帮助有关部门从新闻和民众的情绪中挖掘社会的热点和痛点。
02 告别垃圾分类的烦恼
距离武汉700多公里的杭州市,杭州电子科技大学信息工程学院计算机专业的揭金民也在进行一场人工智能之旅 。
家在杭州的揭金民看到妈妈每天都要花不少的时间对厨余垃圾、可回收垃圾、有害垃圾等进行分类,可由于垃圾的种类繁多,常常出现分类错误的情况。社区只好派驻志愿者在各个小区监督,基本就是居民刚刚扔完垃圾后,志愿者需要重新在垃圾桶里扒一遍。
有志愿者守在垃圾桶旁边检查,大家反而有了“侥幸心理”——毕竟就算分错了类也会有志愿者重新分类。看着志愿者每天在臭气熏天的垃圾桶中满头大汗地分拣,揭金民心里有些不是滋味。有没有什么办法能让妈妈不再为垃圾分类头疼,又能帮助这些志愿者?
作为一名计算机专业的本科生,揭金民想要用人工智能来改变现状:倘若可以用计算机视觉技术对垃圾进行分类识别,居民们就能更轻松地完成垃圾分类,准确性也会提升,志愿者也不用再忍受恶臭翻垃圾桶。
揭金民拉上了两位软件工程专业的同学,以三人小分队的形式践行自己心中的想法。揭金民负责硬件设计,他要做一个三层结构的智能垃圾桶,第一层进行垃圾的识别,第二层对垃圾进行处理,第三层存储不同类别的垃圾。另外两个小伙伴分别负责系统后台和前端的开发工作。
敲定了分工后,必须解决的一个核心问题是打造垃圾分类的算法模型。如果自己写一套图像识别算法,目前的水平和积累跟不上,会拖延产品成型的时间、错过了最佳的市场。好在团队找到了百度的EasyDL平台,作为一个零门槛的AI开发平台,EasyDL上有着丰富的算法模型,包括图像分类、人脸识别等等,算法模型终于有了“谱”。揭金民和小伙伴如释重负,立刻把精力放在了硬件和系统开发上。
在长达一年的时间里,揭金民团队收集整理了近2万张垃圾照片,其中包含大量袋装垃圾,在EasyDL训练后的识别准确率高达96%。硬件设计组装完成后,揭金民将智能垃圾桶放在自己家小区进行试点,目前已经协助用户完成了近1000kg垃圾的分类,异常识别率控制在5%以内。
“这只是第一步。我们想推出家庭版的智能分类垃圾桶,还想尝试推出一种‘代扔垃圾’的服务……”细心的揭金民已经想好了未来的种种可能。
03 解放高空中的补漆工
在国内风能资源最为丰富的西北地区,一座座风车如森林般矗立,源源不断地将风能转化为电能。
然而风机的维护却成了一项让人头疼的难题,西安电子科技大学的黄耀辉了解到风机的维护需要工人们绑着绳索爬到高空中,提着漆桶进行补漆维护作业。
小时候她觉得那是一件有冒险精神的事情,长大后才知道冒险的背后是可怕的风险:高空补漆通常处于二级、三级乃至特级高处作业,二级高处作业坠落死亡率就高达40% ;同时《工业卫生与职业病》中指出,油漆工人中7.2%出现了白细胞数减少, 18.3%患有沙眼,22.8%心电图异常,17.8%视力下降……
作为西安电子科技大学创新创业实验班的学生,黄耀辉在心中一直藏着“解放”高空补漆工的想法,并在课余时间自学了人工智能相关的课程。一次偶然的机会,黄耀辉在学校的微信群中看到同学们在讨论飞桨,在好奇心的驱动下走进了深度学习的世界。
与深度学习结缘之时,黄耀辉也认识了一个同校的好伙伴:左谊。那时左谊正在团队中做一个无人机的项目,他和黄耀辉沟通后,大家迅速萌生了一个新的主意:既然飞桨上有那么多成熟的算法模型,或许可以将人工智能和无人机做一个结合,让无人机替代工人完成高空中的补漆工作。
团队讨论明确了目标后,左谊作为队长将无人机的工作拆解为四个过程。第一步是检查出锈斑并喷涂除锈剂,第二步是让无人机打磨锈迹,第三步和第四步分别是涂刷底漆和面漆。由于团队在无人机巡检和机械控制方面已经有一定的积累,问题主要集中在图像识别和喷绘控制系统两个方面。
团队调用了飞桨里的计算机视觉模型,采用了空地联动的形式进行作业,即无人机将第一时间的图像传送到地面站,地面站搭建高效识别设备并将数据再次发送给无人机。由于采用了视觉SLAM技术,靠无人机上的摄像头就能完成环境的感知工作,不仅降低了硬件上的成本,也提升了实地作业的可行性。
目前这一项目已经在校园内完成了测试:无人机缓缓飞到路灯杆上的电箱附近,准确识别出了电箱上的锈斑,然后打磨、涂刷一气呵成,距离他们解放高空补漆工人的想法已经越来越近。
作为团队的一员,黄耀辉这位大西北土生土长的女孩看到无人机飞起时眼眶竟然有些湿润:“虽然现在还只是一个比赛,但我相信通过我们的努力,那些工人们终归有一天不用再冒着生命危险爬到高空进行作业。”
04 让濒危语言不再消失
遥远的英国南约克郡,正在谢菲尔德大学Lincedo组读博的Xutan Peng(彭煦潭),同样有一个“科技向善”的公益构想。
2020年初的“国际母语日”期间,Xutan Peng在谢菲尔德大学人文学院听了一场演讲,了解到全球现存7000余种有记录的语言中,已经有超过400种濒临灭绝,超过200种处于接近濒危的状态。“语言是文明的DNA”,当一些语言不再被传递给下一代的时候,意味着一个文明正在被人们所忘却。
科班出身的Xutan Peng,发现当下濒危语言的保护手段还是一项“劳动密集性”工作,需要大量专家进行田野调查采集语料。由于还在说濒危语言的人群以老人为主,他们中极少有人能同时使用汉语和本民族语言,导致对语料进行人工转写时存在很大难度。巧合的是,将自然语言处理作为研究方向的Xutan Peng正在关注低资源语言的词典生成,就萌生了以自身一技之长来减轻濒危语言保护工作量的念头。
Xutan Peng戏称自己是个话痨,所以对语言相关的工作有着天生的兴趣。然而现实问题的复杂度远超Xutan Peng的料想,尽管国内已经在少数民族语言保护上做了很多卓有成效的工作 ,可很多濒危语言的文字已经失传,只有语音留存,研究者甚至无法获知其背后所传达的语义。
不过Xutan Peng发现,少数民族的语料主要围绕神话传说、民间故事、民歌和日常会话,或许可以构建现代汉语同领域的语料库,当各自的语料领域相对近似时,可以通过对齐算法建立濒危语言和现代汉语之间的联系。
Xutan Peng先是拿到了相关数据的授权,借助PaddleOCR将相关纸质语料转化成文本,建立了业界首个大规模汉语故事数据集。然后从国际开源语料数据库找到了尔苏、嘉绒、独龙、撒拉四种语言,并将母语者的录音进行国际音标转写。
最终Xutan Peng将少数民族语言词汇嵌入到一个高维语义空间,汉语词汇被嵌入到另一个空间,基于双语词向量结构近似性,利用正交映射对齐两个空间,生成了高质量大规模的双语词典。
目前Xutan Peng已经将导出的词典提供给中国社科院的研究者进行内测,在多数词和名词方面的翻译准确率非常理想,有效提升了对少数民族语言进行转录和濒危语言典藏工作的速度。这位特别能说的大男生不忘强调:“你们看吧,语言就是这么有趣。”
05 AI人才培养需要闭环
看完这些故事,你是否发现这些年轻人们并非都是科班出身,有些甚至在开始这些项目前对编程都知之甚少。但他们也有共性:心思缜密,擅长发现生活中遇到的痛点,并且希望通过人工智能技术去解决。
好在百度飞桨、EasyDL降低了这群少年走进AI世界的门槛,让他们略显稚嫩却充满朝气的想法有了新的可能。
从好创意变成好应用,AI人才培养机制在其中起着关键的作用。虽然越来越多的高校开设了人工智能专业或课程,越来越多的政府和企业为AI人才开出了优渥的条件,动辄百万的年薪也切实激励着当下的年轻人,只是选出“千里马”所需要的不仅仅是伯乐,还要给他们一片可以自由驰骋的宽阔草原。
做一个归纳的话:“闻鼙鼓而思良将,谋大业而召英才”固然有道理,但AI人才培养还需要有人才培养的闭环思维,需要政府、高校和企业一道打通激励、培养、实训、竞赛、就业的产业链条。
至少在刚刚结束的中国高校计算机大赛-人工智能创意赛赛场上,免费的算力资源已经帮他们把想法变成了现实,半年的实操经历也让他们对想要解决的问题有了更深刻的理解。
所幸百度代表的AI头雁们已经开始行动。
前面讲述的四个故事,不过是百度承办的第三届“中国高校计算机大赛-人工智能创意赛”的一隅,同样怀揣梦想的还有2200多支学生团队,他们正在各自关注的领域续写属于自己的故事。就像上一届比赛中获奖的中南大学“AI 知肤宝”团队已经拿到数千万的孵化基金,他们的项目已经联网国内618家医院,帮助10000多名医生进行初步的病情诊断。
其实“以赛促学”是高校AI人才培养中的重要一环,百度打造的一整套AI人才培养体系已经成型:
面向高校,百度为AI人才培养提供了全套教学和数据资源,学习与实训社区AI Studio以及算力等全面支持,联合共建专业课程体系,举办师资培训班,已累计培训了1600多名来自近500所高校的教师;
面向企业,百度打造了黄埔学院、AI快车道、AI私享会等面向不同技术层级的培训方案,构建深度学习专业加实践应用的课程体系。此外,百度还通过开展能力评估认证、举办竞赛等为人才培养保驾护航。
百度已经培养了超过100万AI人才,未来5年,还将培养500万AI人才,为中国智能经济和智能社会的发展提供人才保障。
有理由相信,在百度等企业身体力行的推动下,将有越来越多的“少年”在AI世界里进行一场场“奇幻漂流”,用一个个可以触摸的项目演绎他们心中世界的样子。
彼时我们再讨论百度对于中国AI人才的贡献时,恐怕不只是培养了高端人才的“黄埔军校”,也将是无数优秀AI人才的“启蒙工厂”。