创新奇智，做工业制造的ChatGPT｜甲子光年

频道：行业资讯日期：2023-04-08 00:20:58 浏览：1041

　　“AI+制造”新探索。

　　3月31日，“AI+制造”第一股创新奇智发布2022年全年财报。财报显示，创新奇智在2022年营业期内收入15.58亿元，同比增长80.9%；毛利额达5.07亿元，毛利率32.6%，同比增长89.7%。

　　后疫情时代，主攻制造业AI的创新奇智，能够取得这样的成绩实属不易。

　　人工智能正在进入GPT-4开启的AI 2.0时代。李开复认为，AI 2.0时代带来的变革将会是移动互联网的十倍，人类的生产方式将会被改写，生产力水平也将大大提高。AI 2.0在制造、金融、零售、医疗、文娱等产业都具有非常大的市场应用空间，人工智能的新一波商业潜能有望在各行各业加速点燃，进而提升人类整体智能化水平。

　　以ChatGPT为代表的AI 2.0正在给制造业带来新的机遇。通过通用人工智能（AGI）和生成式人工智能技术（AIGC），可以帮助工业企业更快地构建符合具体场景的小模型，以满足各个生产环节对AI的需求，比如可以快速生成高质量生产数据，指导机器人或产线完成各种复杂的任务，实现更高水平的人机协作。

　　只是，与过往智能制造在推行时候的难点相似，工业领域的AI 2.0在AI能力和行业积累上也有很大的门槛，需要长期聚焦制造业积累行业Know-How。而创新奇智显然就是其中之一。

　　成立于2018年的创新奇智，由李开复的创新工场亲自孵化，自创立之初就关注AI技术的商业化落地，重点聚焦“AI+制造”领域。

　　一方面，创新奇智在计算机视觉和机器学习两个AI领域都有深入研究；另一方面，创新奇智过往在钢铁冶金、面板半导体、3C高科技、工程建筑、汽车装备、能源电力、食品饮料及新材料等各个工业领域都有大客户服务案例，累计客户数量超过400家。

　　2022年1月，成立不到4年的创新奇智便在港股上市，市值110亿港元。

　　上市一年后，创新奇智的业务收入持续增长。即使过去一年有疫情影响，创新奇智客户营收上“AI+制造”业务版块收入依旧达到9.48亿元，同比增长111.2%，营收占比从2021财年的52.2%提升至60.9%。

　　这种增长情况，无疑体现了制造业对AI的渴求。创新奇智也在财报中提到，2023年公司将继续聚焦制造业、积极布局AIGC。

　　日前，「甲子光年」对话了创新奇智CTO张发恩，共同交流了在AI 2.0时代下，创新奇智如何在制造业里通过AIGC为客户赋能。

1.大模型与工业预训练大模型

　　虽然与“AI四小龙”一样，创新奇智也关注图像识别领域、有金融行业的业务；但不同于“AI四小龙”以安防等智慧城市为核心业务，创新奇智的主营业务是制造业AI。

　　谈及将AI应用于制造业，张发恩觉得：“AI 1.0时代，AI凭借感知、预测、决策能力，已经可以完成许多不同种类的任务”。

　　例如在汽车装备领域，创新奇智通过AI技术和对行业的理解，向客户提供全生命周期智能自动化解决方案，包括汽车智能工厂、新能源智能基地、半导体数字化装配车间、离散自动化工业产线和高端装备配套。通过来料质检、生产质量控制和产品出厂检查实现全流程循环管理，实时获取质量状况并识别问题以快速改善。并且，数据可以在各个部门共享，以追溯产品质量。

　　但是，“AI+制造”的进展比预期来得缓慢。客户对AI的接受程度有限、部署的时间和经济成本较高是主要原因，而疫情让制造业的产能和资金链面临着较大风险，也阻碍了AI更快在制造业的推进。

　　以ChatGPT为代表的AI 2.0的出现，让AI开始拥有预测、决策、感知的能力。兴奋之后，所有人也都在期待，大模型是否能在to B领域也出现有效可行的应用。

　　大模型在垂直领域的能力已经被证明。

　　微软在3月22日提交的关于GPT-4的测试论文《Sparks of Artificial General Intelligence: Early experiments with GPT-4》中提到，在使用GPT-4来做小学数学、高中数学、大学数学题时，均超过了专门解决数学问题的模型Minerva。

　　不过，具体到大模型在各个细分领域的实际，还需要行业头部的公司来发起探索。

　　创新奇智在AI技术探索上有持续投入。

　　根据 IDC 发布的《2022上半年中国人工智能软件及应用市场研究报告》，创新奇智在计算机视觉应用市场份额晋升到第 4 名，机器学习平台市场份额持续位居第 4 名，是唯一在两大 AI 技术分支同时名列四强的企业。

　　凭借AI能力，创新奇智正在创新地研发“工业预训练大模型”。物如其名，“大模型”、“工业”和“预训练”是这个模型的特色。

　　首先，这个模型足够“大”。

　　AI生成的内容，要达到或者超过人类水平，如文案、图像等，从学术和工业实践上看，往往需要有生成式预训练大模型（GPT），例如驱动ChatGPT的预训练大模型参数数量有1750亿。

　　张发恩认为，面向行业和面向客户的预训练大模型会成为一个必然需求。技术上，一些先进的技术（例如LoRA）能够有效地使用低算力技术训练千亿、百亿级别参数的大模型。

　　同时，与现有大模型相似的是，创新奇智的工业预训练大模型也使用了Transformer架构。在算力方面，创新奇智对算法进行了优化，让大模型在小算力的情况下依旧可以运行。用业内的话说，“模型越大潜力越大，而大模型的能力可以通过精简过的较小的模型来达到”。

　　其次，这个模型是针对“工业”的。

　　除了大模型都会使用到的通用数据之外，创新奇智还将过往累积的工业数据加入大模型的训练之中。这将成为工业大模型在工业领域超越通用大模型的决定因素。

　　对于各个细分领域的巨头来说，数据——无论是经营数据还是生产数据——都是公司的商业壁垒。在云计算和SaaS被广泛使用的今天，在工业和许多传统行业里，巨头都更愿意在本地部署自己的服务，而不希望把数据放在云上，承担数据泄露的风险。新兴的技术对于这些企业来说只是锦上添花，但企业不会为了AI 2.0下尚未成型的功能就上交自己的数据。

　　与此同时，工业是一个行业Know-How极强的领域，每个细分领域都有自己的知识，在智能化过程中，每个相似的环节都需要根据对行业的理解来重新设计。但这些知识是通用大模型没法凭空生成的，所以，只有服务工业企业、又积累了行业Know-How的公司能够设计出针对工业的大模型。

　　而这，也将成为行业大模型更有效果、更快应用的原因。

2.小样本学习更适合工业场景

　　人工智能领域有一个有趣的现象叫做莫拉维克悖论，指的是机器和AI学习的发展经常会与人类不同，也即机器容易学会一些人类觉得很难的事情，但又很难学会一些人类觉得很容易的事情。

　　在工业领域，莫拉维克悖论更频繁地凸显。

　　例如，机器在替代人类做复杂运算的时候表现很好，但学会做流水线上的工作却需要很久。

　　这也是过去十年里智能制造推进时候遇到的核心难点——工业的每个细分领域都千差万别，而训练机器完成一项固定的工序却需要大量时间和成本。

　　但是，未来在预训练大模型的加持下，小样本学习将让AI在这个领域产生突破。

　　在过去，机器学习中也有“迁移学习”的能力。例如，现有一套程序是用来做面板缺陷检测的。当人希望把程序变成检测另一种类型的面板，或者另一种类型的缺陷时，只需要根据现有的模型进行改写，并且输入少量的样本，即可把之前的程序迁移为新的程序。

　　而现在，由大模型蒸馏出的小模型则更进一步。通过创新奇智的工业预训练大模型，结合新场景和新需求，依旧只需要少量几百张的样本量，就可以生成符合对应场景的小模型。

　　与之前不同的是，“迁移学习”只考虑了测试结果的有效性，并没有关注缺陷检测这个需求在整个生产流程中的成因和相互联系。但通过大模型所蒸馏出的小模型，拥有工业的背景知识，能够更好地达成目标。

　　对于所有行业来说，工业也是小样本学习技术最适合的场景。因为工业场景中每个环节都有所不同，需要新的小模型来辅助完成；但每个环节之间又相似关联，可以通过预训练大模型来蒸馏。

　　张发恩做了一个形象的比喻：“大模型就像是一个巨型的航空母舰，小模型就像是从航空母舰发射出去的一架架小飞机。在航空母舰上可以搭建多样的小飞机，来完成不同的任务”。创新奇智正在做的，一方面逐步推进大模型航空母舰的研发，同时不断打造针对垂类场景的一架架小飞机。

　　除了生成符合具体功能的小模型之外，创新奇智工业预训练大模型还可以生成“数据”，也即通过对现有样本的学习，源源不断地创造新的样本，从而可以提升工业领域样本不足情况下的模型精度。

　　结合小样本技术和AI样本数据生成功能，仅需少量场景数据辅助描述，便可生成大量针对该场景的样本数据用于模型训练，最终大大降低工业领域AI模型的生产应用门槛和模型生产成本。

　　张发恩估计，利用大模型、小样本学习和AI数据生成技术，预计可以使客户节约50%的费用，训练时间有望降低到原来的1/3。不过在当前，这三者都还不够成熟完善，仍处于探索阶段，也都需要持续的实践经验和数据的补充。

　　不过，创新奇智已经表现出在AIGC上投入的决心。基于工业预训练大模型、小样本学习和AI数据生成技术，创新奇智研发了面向工业的AIGC产品—AInnoGC。AInnoGC除了拥有样本生成的能力，应用在能源电力、半导体检测领域之外，还拥有产线布局生成能力，可以帮助工厂自动规划生产产线、帮助仓储区域优化布局。

　　另外，AInnoGC还拥有智能解答的功能，能够在AI实训中心，基于现有的工业知识图谱，用对话的方式解答学员的问题，帮助新入职的技工更快了解工作内容。

3.坚持研发创新 2~3年后AI 2.0在工业领域爆发

　　3月31日，创新奇智发布2022年全年财报。在2022年营业期内收入15.58亿元，同比增长80.9%；毛利额达5.07亿，毛利率32.6%，同比增长89.7%。

　　相比起2018年，创新奇智客户的客户营收上“AI+制造”业务版块占比从36.6%上升到了60.9%，达到9.48亿元。财报中也提到2023年将继续聚焦制造业、积极布局AIGC。

　　但依旧不变的是在研发方面的投入。从2021年的3.3亿元增长了27%达到2022年的4.2亿元，研发占收入比例为25%。

　　虽然，企业扣除股份支付及上市开支等项目后的经调整依旧净亏损1.38亿；经调整净亏损率为8.9%，但这个数字较2021年度降低7.6个百分点，同比缩窄46.1%。

　　目前，创新奇智的AInnoGC已经在半导体、能源电力、智造实训等领域实现了应用。

　　在半导体领域，硅片生产过程中，可以通过AInnoGC平台模拟不同产线工艺差异，生成大量高质量硅片崩边、缺角、裂纹、线缝的缺陷样本，以更高质量、更准确地进行缺陷检测。在能源电力领域，AInnoGC可以自动生成大量风电设备磨损、倾斜的图像，来帮助风电大组件实现未来的智能预警和精准判断。

　　相较于传统AI公司或大模型公司，创新奇智坚持“AI+制造”两边都深耕的策略，既关注AI发展，又关注行业积累。张发恩预计，2~3年之后，AI预训练大模型和数据生成、小样本学习等技术就会逐步完善、达到理想状态，届时AI在工业界的应用将会有显著的爆发。

　　这次以ChatGPT为代表的AI 2.0的浪潮下，创新奇智入局工业AIGC，并非一时兴起。早在2017年谷歌团队发布关于Transformer架构的论文《Attention is What You Need》之后，创新奇智研发团队的成员就已经开始关注此项架构，在公司成立之后也有专项研究。在近日根据智慧芽数据库检索出的《中国人工智能大模型企业发明专利排行榜（TOP 50）》，创新奇智大模型发明专利位居35名。

　　工业AIGC既是行业大模型的大势所趋，也是创新奇智坚持的研发路径。对于类ChatGPT的技术，创新奇智的态度是“拥抱它”“应用它”“发展它”。在3月31日晚的业绩沟通会上，创新奇智管理层明确表示，要牢牢把握全球数字化经济和中国制造智能化转型加速的增长机遇，同时会积极地投入拥抱AI 2.0浪潮，继续务实高效的做好技术、产品、场景、商业的平衡发展，做好大模型技术应用的创新旗帜。

　　通用大模型正在以天为单位迅速发展当下，未来具体的应用还需要靠深耕行业的服务商来实现。未来，每个行业都会有自己的ChatGPT，而创新奇智要在AI 2.0时代里做制造业的ChatGPT。

炒股开户享福利，送投顾服务60天体验权，一对一指导服务！