本篇文章3360字,读完约8分钟
文|明白|秦言
资料来源:我能看到备忘录
面部识别已经在各行各业广泛使用,但新冠引起的肺炎袭来时,戴口罩的你是怎么解释你的?
找到嫌疑犯了,但视频没有捕捉到他的脸。 衣服的颜色,布料的纹理,可以找相似的id吗?
有违反和犯罪行为的车辆,如果经常隐藏车牌,采用夹克,不能用车牌正确识别车辆身份,能以更细致的外观找到吗?
视频识别在我们现实中的应用越来越广泛,很多我们想得到,想不到,ai给我们带来了更多的惊喜和惊喜。 但是,这也是在过程中,现实的应用场景对ai持续着更高的挑战:以前能识别人脸就好了,现在必须能识别戴口罩的人。 以前用脸部照片追踪罪犯,现在即使看不见脸也能找到他以前用车牌号码识别车辆身份,现在必须用车身细节追踪……
“人们往往高估了技术的短期表现,低估了技术的长期表现。 ”。 从事17年计算机视觉研究的格灵深瞳新闻技术有限企业cto邓亚峰深入体会,ai是长跑,自己的实力非常重要,陪伴的伙伴也非常重要。
no.1看了就知道,ai只有落地于各行业才有价值
关于ai,经常听到智能城市、机器人、自动驾驶、智能医疗、工业视觉、ar等。 这些是ai的应用场景。 说到ai的核心技术,是计算机视觉、语音识别、自然语言理解三个方向。 也就是说,三个技术方向的深度可以应用于各种场景来发挥价值。
在我们人类的物理世界中,视觉可以占人体各种感觉器官接收新闻的80%。 所以,视觉是人和外界信息表达的最重要的途径。 同样,在数字世界中,计算机视觉的迅速发展也决定了ai的方向和能力。 “计算机视觉是智能物品在互联网时代最大的数据门户,有着广泛的应用场景。 ”格灵深瞳新闻技术有限公司cto邓亚峰说,无论是智能城市、机器人、自动驾驶、智能医疗、智能制造,这些都不能脱离计算机视觉这一ai基础技术。
在智能城市的应用中,可以从人的行动轨迹中寻找线索,发现规则,事先预知异常。 比如,有一个个体白天不外出,经常半夜外出,行动轨迹也不去一定的事务所的话,这个身体就有可能是嫌疑犯。
例如,在智能商务中,通过脸部识别多次带同一个个体去商店,利用脸部关联商品的购买记录,在动线和热上下功夫。 在某些情况下,大数据( 603138,是股票吧)聚集在一起,ai真的会“比你更了解你”。
虽然不能“看”的世界,但“理解”的世界非常难。 中国现在有近2亿的安全摄像头,其视频数据的80%是冗长的消息。 ai如何通过深度学习、高性能运算和大数据技术从这些数据中挖掘有用的价值?
格灵深瞳是一家以“向电脑展示世界”为愿景的企业。 他们是与华为共同构建的全目的结构化系统,将结构化分解、数据存储、数据应用于一体的高性能、高密度计算系统,处理人体、汽车、非汽车、脸等全目的的特征识别和快速检索。 其主要功能包括目标检测、跟踪、分类、全目标特征识别、图检索、轨迹分解、综合布控、违法分解等应用。 该系统可以比较有效地解决大规模视频数据,具有同时能力强、分解识别准确、计算速度快、检索效率高等特点,可以实现警告、布控、研究判定等多种应用,提高事件效率。 适用于包括智能城市、公共安全行业在内的各种场景。
no.2不需要反复制作车轮,算法工程师的工作变得简单且极限
单机实现384路终极高密度视频实时分析,支持图像分析(检测、结构化、特征提取)的1200张/秒以上听起来不明的技术是如何在高效的机器视觉系统中实现的?
通常,高效的机器视觉系统取决于四个重要因素:核心算法、大规模训练模型自动化、智能数据挖掘和标注、基于硬件平台的计算优化。
这样,在以往流传下来的算法开发模式中,工程师在解决参数等基础业务上花费了很多时间,真正发挥其价值的时间很少。 另外,机器的gpu利用率低,硬件无法一个一个发挥其性能。 形成了人才价值和机器价值的双重浪费。
看到改进的开发模式,通过设计和开发工具,帮助数据的收集和解决,工程师管理数据、框架和计算资源,训练效率、资源的采用效率非常高,工程师的时间都用于高价值的工作拷贝
“通过虚拟化环境,系统更高效地利用了计算资源、存储资源,简化了算法工程师的工作。 ”邓亚峰总结道。
从前后两种发展模式来看,区别在于大规模的训练平台。 “大部分企业不需要重新制作车轮”邓亚峰表示,建立高效的大规模训练平台相当于其“车轮”,将算法工程师从大量低端重复作业中拯救出来。
那么,如何构建通用高效的车轮呢?格灵深瞳使用了“数据并行+模型并行”的方法。 简单来说,就是把数据和模型分配给不同的机器运行,通过巧妙的分割、设计,减少不同机器之间的数据交换量,平行扩展计算资源,实现非常高的训练效率。
这就是深瞳大脑的设计构想。 从“数据-标记-算法-培训-产品-数据”构建正循环。 这个培训框架可以支持百卡集群培训、数亿级任务培训、最多数百层和数十亿参数的深度学习模式。 “终极目标是工程师建立这个框架,通过标记数据,系统计算出完美的结果。 ”。 邓亚峰说。
no.3找那个“钥匙先生”
如上所述,高效的机器视觉系统有四个重要因素。 其中前三个与框架相关联,由内部工程师智慧处理。 四是外力如何选择最好的“伙伴”。 邓亚峰认为这几个极其重要。 “如何选择平台,计算极高。 这与效率和价格密切相关”
华为atlas、海思nnie、movidius、tpu、npu……对工程师来说,现在市场上的选择很多。 邓亚峰给出了一些重要的考虑标准:性价比怎么样? 开发价格怎么样? 你能提供完整的接口和框架吗? 生态的持续性怎么样?
他认为平台的完整性和生态的可持续发展很重要。 首先,多平台的开发和维护很贵。 如果一个平台没有云、端和端的完美能力,工程师必须开发多平台并保持多平台。 添加新平台不仅会增加资金的价格,而且价值成本可能无法承受公司。 因此,选择具有云、端和端完美能力的平台可以减少不必要的重复工作。 其次,必须选择长期快速发展的生态。 如果生态没有保障,很多前期的投入都有可能无效,这是更可怕的事件。
基于这样的想法,格灵深瞳选择鲱鹏解决器+atlas 300加速度卡,结合自制行业顶尖的全目标(脸、人体、车辆、非汽车)结构化算法,构建自己的平台,进行系统调度、 在单机上实时分解384通道的终极高密度视频。 其中atlas 300 ai加速器卡是“钥匙先生”,基于310ai和910 ai解决方案升级后的atlas 300 ai加速器卡,适合人工智能训练和推理场景的各种数据。
“我们的业务优势是模型非常多,各种解决办法多方面。 atlas 300有非常多的资源。 ”邓亚峰对双方共同制定的处理方案非常满意,“这已经是领域非常领先的结果”。
华为人工智能计算平台有强大的计算能力,云、边、端丰富的产品,使综合价格更低。 邓亚峰认为,更重要的理由是华为在生态上有非常大的决心投资。 “我们开发的中间也遇到了一些困难,华为非常积极地支持我们,和我们一起调整。
格灵深瞳去年参加了领域最具挑战性的“非限制性自然环境脸部照片”测试项目,根据世界上最权威的脸部识别算法测试( frvt )发表的结果,格灵深瞳取得了世界第一的成绩。 另外,在2019年北京市交通局组织第一届交通行为图像智能识别技术大赛中,格灵深瞳的行为识别算法也获得了全国总排名第一。
理解一下,格灵深瞳选择华为主要有两个理由。
第一,华为atlas智能计算平台的强大计算能力和完整性。 基于华为上涨系列ai解决方案和行业主要层的异构计算部件,通过模块、板、小站、服务器、集群丰富的产品形态,构建面向“端、边、云”的全场景ai基础设施方案,平安城市、智能
第二,华为开放的生态和对生态伙伴的雄辩支持。 华为atlas智能计算平台支持行业主流框架,支持易用的代码迁移和模型转换工具,以灵活的协作方式与行业isv共同构建,共同获胜。 也就是说,选择防火墙atlas智能计算平台是选择开放的标准,选择越来越多的合作伙伴,选择越来越多的机会。
如果人工智能是长跑,选择最好的伙伴是到达终点的必要条件。 对格灵深瞳来说,华为atlas人工智能计算平台是其陪同的“关键老师”。
本文首次在微信公共平台上发表:备忘录可见。 文案是作者个人的观点,不代表网络的角度。 投资者据此,风险请自己承担。
标题:“让计算机看懂世界:格灵深瞳与华为Atlas AI的故事”
地址:http://www.china-huali.com/cjxw/34877.html