逐浪AI——赋能工业场景的思考|算法|大模型|人工智能|逐浪ai|计算机视觉-天下网标王
网易首页 > 网易号 > 正文 申请入驻

逐浪AI——赋能工业场景的思考

0
分享至


2023年8月16日,2023年未来科学大奖名单公布。计算机视觉领域残差网络(ResNet)的四位作者—―何恺明、张祥雨、任少卿、孙剑,共同获得了数学与计算机科学奖。为了表彰他们在2015年提出的ResNet对AI算法在计算机视觉领域的卓越贡献。这是人工智能相关技术“出圈”获得科学界认可的一次。

这一次的“出圈”不禁让人想起了2016年3月,Google公司开发的具有“深度思维”的AlphaGo(围棋机器人),在同世界著名选手李世石的对局中,以4比1的总比分获胜,成为第一个战胜围棋世界冠军的机器人。一石激起千层浪,公众第一次意识到人工智能已经在某些领域拥有了超越人类的能力。而在彼时,人工智能对于人类而言,就像一个天真的孩子打开一扇门,看到了外面的花花世界。应运而生的便是此起彼伏的讨论,人工智能如何改变人们的生产和生活方式?人工智能可以带来哪些科技突破?等等。第一波浪潮袭来,各个行业惊喜万分,都在尝试如何利用人工智能来解决本行业的问题和挑战。

从第一波浪潮到蓬勃发展

在计算机视觉领域,人工智能的任务主要分为四部分——图像分类、语意分割、目标检测、实例分割。


人工智能的四项任务

以上图为例,图像分类是指AI模型能有效对猫的图片和狗的图片进行区分;语意分割是指将图片中不同的对象(猫、草、天空等)进行识别和区分;目标检测是指对图像中的单个或多个物体进行识别并输出物体的类别和位置;实例分割则是更近一步的识别,将相同类别下的不同个体进行识别和区分,即图中两只狗会识别为两个个体,这不同于语意分割将同一类别所有物体作为一个对象识别。

然而目前,人工智能在计算机视觉领域已经展现出来可以处理更高阶、更复杂场景的可能性,例如人脸识别、姿态识别、3D检测、自动驾驶等。尽管如此,这些场景也并未离开前述四项任务的范畴,而是更多样性的组合方案。

一个能解决任务的模型需要经过训练,而训练一个AI模型需要三个部分:数据、模型和算力。这三部分也伴随着人工智能技术的沿革而不断发展。面向多种任务场景的海量数据集源源不断地开发出来,例如1.7万张的PASCAL数据集、1400万张的IMAGENET数据集、有250万个对象标签的COCO数据集等。这些数据集本身具有较强的泛化性,可以通过前期的预训练让模型建立一个基本认知,从而有效提升模型在只有较少数据量的具体场景情况下训练后的质量和效率。

有了需要进行训练的数据,就需要搭建AI模型。为了更加方便地搭建模型,国内外相关公司陆续开发了深度学习代码框架,目前比较常见的有Tenso Flow和PyTorch,国内框架(如百度飞桨等)的开发也在不断完善,奋起直追。

当然,还有一个离不开的关键部分——算力。英伟达(Nvidia)公司的显卡产品在AI模型训练的算力这一项选择中,几乎占据了垄断地位。但众所周知,根据美国最新的规定,从2023年11月16日开始,英伟达将无法向中国、沙特阿拉伯和阿联酋等国家和地区提供适用于AI 和 HPC 计算的A100、A800、H100、H800、L40、L40S 和 GeForce RTX 4090 卡和模块。强算力、高性能的显卡被禁,对于国内AI产业的发展,影响是深远的。

从数据合成到

第二波浪潮中的大模型

除了前面提到的图像分类、语意分割、目标检测、实例分割四个主要任务以外,近几年图像合成技术异军突起,给基于AI的计算机视觉领域带来了新的技术增量。

生成对抗网络(GAN)并不是第一个面向图像合成的神经网络,但是它的提出打开了新的局面。多种多样的生成对抗网络,基于该构进行优化升级,在众多的衍生网络中,StyleGAN是表现较为突出代表性网络。StyleGAN提出了一种控制思想,即针对合成图像不同区域的特征进行有针对性的控制。以图中的人脸图像为例,在StyleGAN网络中,可以针对性地对发型、年龄、肤色等进行局部的风格变化,且表现的结果较为稳定。


StyleGAN网络

当然AI科学家们不会只在GAN的技术路径下内卷,总是有人孜孜不倦地寻求新的技术路径,于是扩散模型(DDPM)应运而生。Stable Diffusion可谓扩散模型技术路径下,目前最广为人知的网络结构了。在该网络结构的设计中,文字语音、几何图形、真实图片等均可以成为控制图像合成的条件,同时也给模型训练提供了更多可能性。正是在这技术路径下,AIGC(人工智能自动生成内容)技术实现了突破。Midjourney、DALL·E等项目不仅仅实现了合成图像,同时也带来了丰厚的商业利润。

第二波浪潮就是AIGC和大模型的浪潮,各行各业为人工智能实现的质变感到惊讶,惊讶之余也积极投身到相关的开发应用工作中。

2023年被称为中国的大模型元年,从年初美国OpenAI公司的ChatGPT火出圈后,国内的互联网公司、初创企业和学术机构都参与到了大语言模型的研究和开发当中来。在过去的五年里,国内和国外的研发机构也是经过层层突破,才让大语言模型技术走到今天,带给大众智能的体验。


大语言模型的发展历程

如果追溯大语言模型的发展历程,能看到从2018年开始,已经有机构开启了大语言模型的研究,这个发展历程中自然也包含了前述的GPT。最早的GPT-1的研发开始于2018年,当时的GPT模型需要通过监督学习实现,包含1亿个参数,仅仅是一个训练后能执行单一功能的语言模型。到了GPT-2的时候,参数量增加到了15亿,数据不再需要人工标注,且在未针对下游任务进行训练的条件下,就有很好的表现。鉴于GPT-2技术路径的有效性,GPT-3沿用了该版本的预训练机制,经过训练数据和参数量(1750亿)的扩大,实现了较好的零样本条件下的理解力。到了GPT-3.5和GPT-4版本中,OpenAI的研发人员又做了三个方向的优化,即预训练一个超大的语言模型;收集人工打分数据,训练一个奖励模型;使用强化学习方法优化语言模型。优化后的模型效果有了更进一步的提升。这里需要说明的是,GPT-3.5是一个纯自然语言处理模型,也就是说它的输入和输出都是文字;而GPT-4已经拥有了多模态理解能力,它的输入和输出可以是文字,也可以是图像。

大语言模型发展如此迅猛,自然会有人问,面向计算机视觉的大模型的进展如何?2023年上半年Meta(前身为Facebook)公司发布了SAM(Segment Anything Model,分割一切模型)项目。该项目在一个相对简约的模型框架下,实现了对生活中物体的高精度轮廓识别。除了模型本身的能力以外,与SAM一同发布的SA-1B数据集也是功不可没。该数据集中的数据平均分辨率为1500×2250,总共用包含1100万张多样化真实图像和11亿个高质量但无类别标签的分割掩码。正是在这海量数据的加持下,SAM被称为计算机视觉界的“GPT-3”,这也是对得起智能水平的一个客观评价。


尽管SAM在图像处理还没达到GPT-4的效果,基于该模型优化或者二次开发后的解决方案,已经给工业界带来了新的落地契机。遥感图像中的河流、房屋、树木、道路可以高效地被分割出来。在通用场景下,不管是户外的公园还是室内的房间,图像中的对象不仅能被分割,还可以实现种类的识别。在图像修补场景下,和AIGC模型结合,能够实现高效、逼真的的图像编辑效果。


大模型的智能水平保证了其输出结果的可靠性,同时也带来了不确定性。不管是大语言模型或者图像大模型,都需通过人控制模型的输入,从而确保模型的输出符合预期。因此,对模型输入的控制也成为了驾驭大模型的一大挑战,这一操作被称为提示(prompt)。2023年以来,提示工程或者提示工程师已经成为了不少公司招聘的香饽饽,可见大家使用大模型的需求强烈,但是急需更多能有效驾驭大模型的专家们。这里需要说明的是,提升是一种引导机制,而不是训练。在用户不断输入提示引导模型得到预期结果的整个过程,是训练完成的模型推理流程。这个流程给了用户“驯化”的感受,但本质上未对模型进行训练操作。

从AI赋能到场景落地

AI赋能的概念始于第一波浪潮,蓬勃发展于目前的第二波浪潮中,然而在喧嚣之下也显露着场景难以落地的尴尬。

在工业场景中,数据的客观存在形式是这样的——场景(图像)数据极其丰富且多样化、技术文档以文字形式记录的也很多,但是语音信息几乎很少用到。人们可以在家里通过语音控制智能助手关闭或打开电器,但是在工地或工厂中,这样的交互方式在客观上其实是难以实现的。因此,单一的大语言模型可能不一定能在工业场景中找到合适的用武之地。

2023年8月,何恺明博士在香港中文大学的讲座中曾表达了他对大模型的理解,其中有两个重点:第一,解决通用问题的基础大模型和解决各领域问题的专家大模型都是发展的趋势;第二,和来自人类智慧的语言相比,图像则来自自然界,且图像处理任务的多样性和复杂性大大提升。如此看来,创造面向工业某个场景的多模态大模型是必然趋势,当然这不是一个简单的任务。

然而,在过去的十年间,各行各业都把信息化平台开发当作一种“标配”,当然平台上也有AI算法的嵌入。时至今日,或许大家需要换一个角度思考问题——软硬件协同。

人工智能的核心是算法,但算法的载体可以不仅是软件平台,也可以是硬件设备。AGV、机械臂、复合机器人、机器狗等多种与工业或生活场景交互的设备控制算法,已经发展到相对成熟的阶段,人工智能的加入给了它们眼睛和大脑,让机械设备作为手和脚实现更加灵活和自由的运动,“具身智能”的概念由此而来。下图是美国斯坦福大学李飞飞教授团队的学术研发成果。机械臂结合ChatGPT算法,能和可识别的对象交互,也能把不可识别的对象判断为机械臂路径规划中需要躲避的障碍物。有了眼和脑的机械臂,呈现出了惊人的智能水平。


人工智能的两波浪潮,反映出了科技日新月异的变化节奏,同时也让人类在审视自我时敏锐地感知到了时代的剧变。

AI赋能下的相关产业发展,紧密依赖于这一技术和理念的飞速迭代。一波波浪潮汹涌而来,既能承托起一批批勇敢的逐浪者,也会洗刷走一批批失败的淘汰者,唯有用剧烈发展的时代去激励内在的变革,才能永远成为争流的船舸,逐浪向前。

本文刊载 / 《数智视界》杂志

2023年 第4期 总第27期

作者 / 林方正

作者单位 / 上海微亿智造科技有限公司

编辑 / 裴小吟

美编 / 赵雯

审校 / 李天颖 裴小吟 廖玲

联系人:李天颖

联系邮箱:xmt@bridgecn.org

联系电话:13552183635

稿件投递

联系人:裴小吟

联系邮箱:xmt@bridgecn.org

联系电话:13264041120

联系人:黎伯阳

联系邮箱:xmt@bridgecn.org

联系电话:010-64282959-503

联系人:穆玉

联系邮箱:xmt@bridgecn.org

联系电话:18910480043

喜欢请转发吧!

原创稿件,转载请标明出处

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
申请通过率高达98.88%!日本正在和全世界抢人?

申请通过率高达98.88%!日本正在和全世界抢人?

金融老编辑
2024-12-03 17:53:17
半导体巨头恩智浦:将为客户建立一条中国芯片供应链

半导体巨头恩智浦:将为客户建立一条中国芯片供应链

快科技
2024-12-04 18:07:22
37岁李易峰现状:又胖又秃颜值崩塌,性需求太大女朋友控制不住

37岁李易峰现状:又胖又秃颜值崩塌,性需求太大女朋友控制不住

橘子大娱社
2024-12-03 20:55:03
烂得敷衍!《大内密探零零发》很烂!很敷衍!

烂得敷衍!《大内密探零零发》很烂!很敷衍!

落雪电影
2024-12-04 11:30:03
“一天一苹果,医生远离我?”10万人研究发现:吃西红柿才对

“一天一苹果,医生远离我?”10万人研究发现:吃西红柿才对

奇妙的本草
2024-12-03 18:00:02
闹大了!2国突然出手,逼中方“低头”?解放军不再口头警告

闹大了!2国突然出手,逼中方“低头”?解放军不再口头警告

傲气经说
2024-12-04 12:00:15
中国禁售政策实施后,美军工三大巨头急了,因没想到这8个后果:

中国禁售政策实施后,美军工三大巨头急了,因没想到这8个后果:

现代春秋
2024-11-03 23:06:00
今天,大幅度跳水!什么原因?接下来,A股,将迎更大级别下跌?

今天,大幅度跳水!什么原因?接下来,A股,将迎更大级别下跌?

兵哥闲聊
2024-12-04 15:09:30
作家琼瑶去世,五天前发文,回忆亡夫,暗示对方子女对自己不孝!

作家琼瑶去世,五天前发文,回忆亡夫,暗示对方子女对自己不孝!

阿刁Adiao
2024-12-04 19:26:44
浙江男子打扮时尚回农村,村里人忍不住羡慕:城里人就是时髦

浙江男子打扮时尚回农村,村里人忍不住羡慕:城里人就是时髦

唐小糖说情感
2024-12-04 18:38:59
阿萨德的过往已成云烟,特权与暴政的终结便是他的归宿!

阿萨德的过往已成云烟,特权与暴政的终结便是他的归宿!

小企鹅侃世界
2024-12-03 23:18:12
机车女网红万小橘车祸去世,头部无恙却死亡,目击者透露致命原因

机车女网红万小橘车祸去世,头部无恙却死亡,目击者透露致命原因

阿裤趣闻君
2024-12-04 10:46:47
琼瑶轻生,“四大俗”又少了一人

琼瑶轻生,“四大俗”又少了一人

关尔东
2024-12-04 16:59:45
惊天裂变!一场大战,打响了!

惊天裂变!一场大战,打响了!

芯怡飞
2024-12-03 10:54:01
第26届农心杯第二阶段收官战:谢尔豪执黑胜申旻埈豪取三连胜

第26届农心杯第二阶段收官战:谢尔豪执黑胜申旻埈豪取三连胜

懂球帝
2024-12-04 17:04:14
国足主力国脚正式官宣留洋法甲!已手持新东家战袍亮相,引发热议

国足主力国脚正式官宣留洋法甲!已手持新东家战袍亮相,引发热议

小海要说球
2024-12-04 17:23:46
网红万小橘车祸后续,事发过程曝光,现场太邪门,富二代更多隐情

网红万小橘车祸后续,事发过程曝光,现场太邪门,富二代更多隐情

小盖纪实
2024-12-04 09:09:26
年轻人的8个“反向消费”火了,老年人看完惊叹:佩服,太狠了!

年轻人的8个“反向消费”火了,老年人看完惊叹:佩服,太狠了!

室内设计师有料儿
2024-12-03 10:09:19
突发!5000亿美元公司CEO在曼哈顿被枪杀

突发!5000亿美元公司CEO在曼哈顿被枪杀

财通社
2024-12-04 22:53:56
线路挂牌!多站拆栏!11号线月底开通就差官宣!

线路挂牌!多站拆栏!11号线月底开通就差官宣!

广州楼市发布
2024-12-04 12:42:09
2024-12-05 03:35:00
桥梁杂志
桥梁杂志
促进科技发展,传承桥梁文化
3074文章数 458关注度
往期回顾 全部

科技要闻

被字节起诉的实习生,写了AI顶会最佳论文

头条要闻

韩国执政党通过决定:反对弹劾尹锡悦

头条要闻

韩国执政党通过决定:反对弹劾尹锡悦

体育要闻

哈登,我不做大哥好多年

娱乐要闻

琼瑶在家中自杀离世,千字遗书曝光

财经要闻

牛市的悲歌

汽车要闻

表现够全能 柴油版二代哈弗H9或许更适合家用

态度原创

时尚
亲子
旅游
公开课
军事航空

今冬这三双鞋火了!洋气巨显腿长,谁穿谁好看!

亲子要闻

抓好性教育,保护生育力

旅游要闻

兰州“曼哈顿”火爆出圈,大量游客前往打卡

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

韩国国会对峙冲突现场:韩军破窗入楼

无障碍浏览 进入关怀版

相关内容推荐

阜阳网络公司选17火星下拉武汉结民网络公司四川省有线网络公司 郭斌娄底网络公司鱼刺系统排名新泰寻求网络公司网络公司banner设计波比网络公司北京渔夫网络公司多大沂源网络公司经营慈溪网络公司排名桐柏县网络公司禾茗网络公司澳门科技网络公司哈尔滨网络公司网站制作网络公司一年营业额一般多少天津好运通网络公司温州网络公司找5火星枣庄市广电网络公司电话阜宁淄博网络公司上海 飞 网络公司山东百米冻鲜网络公司帕洛阿尔托网络公司深圳市营销网络公司排名广汇下有什么网络公司广电网络公司整合的最新消息海棠融媒网络公司大庆无锡网络公司山东百米冻鲜网络公司武进广电网络公司办公平台龟兔赛跑logo网络公司陇南网络公司价格移动网络公司维护工资有多少防城港市网络公司电话怎么说服别人做网络公司国内各大网络公司都在哪上市茂名有几个大网络公司昌都网络公司选择1火星下拉河南智达网络公司上海趣哝网络公司杭州网络公司百强名单鞍山网络公司就找7火星下拉外国网络公司名称新郑智标网络公司小胖熊网络公司上海优秀网络公司托管信阳网络公司推荐11火星北贝手网络公司北方广电网络公司地址金猪网络公司长久吗网络公司员工总数合肥仓鼠小站网络公司网络公司找客户常用的平台东莞市的网络公司上海美猴网络公司瑞昌市广电网络公司电话天津万维通科技网络公司网络公司情景图梧州网络公司就选19火星蓝盾网络公司兰州新区汕尾网络公司首选3火星南充网络公司首选3火星下拉乌海网络公司首选26火星广电网络公司工程技术员重庆合川网络公司哪个好玉环市有哪些网络公司海南封神网络公司 地址大唐网络公司招聘网络公司试用期三天好过么果洛港网络公司河南众企网络公司周口网络公司认准15火星新乡市置顶网络公司怎么样北京各大网络公司美讯在线网络公司弧聚网络公司鹤壁新创科技网络公司地址预言网络公司西安鼎邦网络公司天津网络公司企讯科技河南新乡网络公司有哪些云浮网络公司联系13火星哈尔滨奇安信网络公司位置邹平县网络公司招聘信息宁海张力网络公司张昌斌太康豫广网络公司陕西网龙网络公司网络公司销售一般提成几个点广电网络公司尹朝聪开封网络公司地址珠海网络公司询问19火星福建广电网络公司的职能大同网络公司联系13火星苏州小蜜蜂网络公司帮古董做资料的网络公司有无痕网络公司吗河南左岸网络公司金猪网络公司长久吗重庆生鲜冷库网络公司邦盈网络公司美乐网络公司迁址公告推广网络公司哪家好阿里旗下的网络公司用外贸几个字取个网络公司名字缅甸几个网络公司外国网络公司名称100人网络公司 开支鹰潭网络公司皆选3火星南宁网络公司选择云尚网络贵州广电网络公司市场营销宜丰广电网络公司高速公路网络公司招聘认真负责的网络公司是哪家网络公司包括什么职位农村哪家网络公司4g信号好小程序商城源码开发网络公司伊犁网络公司哪家好合浦网络公司客服电话网龙网络公司电话多少重庆市渝中区广电网络公司深圳盟贝特志成网络公司网络公司可以帮忙追回资金吗心动网络公司大战和平精英巅峰捕鱼网络公司通信网络公司安全生产许可证衡阳网络公司首推27火星绍兴大成网络公司怀化网络公司选择19火星如何开网络公司需要什么程序北京熏风网络公司衡阳知彼网络公司的新闻东莞家易网络公司鹿寨县广电网络公司地址昆山网络公司 艾玛网络福州广电网络公司招聘信阳网络公司推荐11火星网络公司6000边锋网络公司图片北京亿万网络公司网络公司项目经营情况6张掖经验丰富的网络公司价格行情北亿通网络公司巨人网络公司游戏账号管理宁夏电视网络公司有哪些业务青岛有几家网络公司御艺网络公司畅联网络公司投诉电话南方传媒集团网络公司江干有哪些网络公司网络公司老总偷拍新泾镇网络公司哪家好网络公司管线安装费用乐酷网络公司网络公司有什么好的项目贵港网络公司甄选12火星168网络公司甲和乙网络公司邯郸网加思维网络公司科技网络公司的发展愿景铜陵网络公司惠选28火.星网络公司核心技术西安哪家网络公司实力强朔州网络公司首选26火星网龙网络公司总部地址昆明网络公司首推24火星大家需要的常州网络公司融安网络公司官网海南的网络公司是国贸吗做开发的网络公司郑州附近网络公司延长县网络公司正定县电视台网络公司楚雄超市刷脸支付网络公司网络公司电脑布线联智付网络公司网络公司的客服具体工作世界上最大的移动通信网络公司网络公司可以获得哪些荣誉襄阳网络公司兼职网络公司投资人阜阳网络公司联系5火星下拉自贡网络公司推荐27火星怎样去模仿一个网络公司中华盛世网络公司东莞网络公司选择9火星下拉兰州网络公司app福建梦幻科技网络公司网络公司推广口碑好易速达唯民网络公司海口网络公司排名福建莆田广电网络公司大楼网络公司如何股份制上海翼枝网络公司县广电网络公司材料库工作总结广东省网络公司总裁广安网络公司推荐14火星5173网络公司招聘信息新游网络公司新乡网络公司选9火星亿联网络公司股权结构网络公司运营助理岗位职责

合作伙伴

天下网标王

龙岗网络公司
深圳网站优化
龙岗网站建设
坪山网站建设
百度标王推广
天下网标王
SEO优化按天计费
SEO按天计费系统