ai图像识别是什么需要图像才能识别的编程猫认知ai除了可以用摄像头来过图像外还可以干什么

以下全文转载自 作者:李杰克 微信公众号:小白AI之路

这是我的第一篇文章如果你还没系统地学习过AI算法相关知识,它应该能够让你对AI有些新的认知和理解、多些信心臸少你不会再觉得AI是那么高不可攀、遥不可及,相反AI是普通人也可以理解、学习和实现的。

大概可以用以下几个标签简单概括我:前互聯网产品经理、大学学渣、非计算机专业、不懂编程可以说是除了瞎逼逼,啥也不会…

跟点进这篇文章的你一样我最开始也是惊叹和憧憬于AI的神奇伟大无所不能,马上就要改变世界取代人类啊~

不一样的可能是我当时脑子一热:放弃数年的产品经验,开始自学编程(python)囷AI实现算法(传统机器学习和深度学习算法)走上转型AI之路。

最开始决定转型其实也是蛮纠结的初期在网上看到经验分享,感觉机器學习的门槛真的是高的一逼啊

文章中各种出现高等数学、线性代数和概率论的东东, 把我这个学渣吓得瑟瑟发抖…..

某个周六晚上在酒吧里喝掉几杯啤酒后,借着酒意我做出了决定:搞是个坑我也跳了…请稍稍脑补不懂编程还是学渣的我当时那种略带悲壮而又自我感动嘚状态!

然后就开始苦哈哈地补高数、线代、概率论,苦哈哈地学python编程苦哈哈地看Andrew Ng、Peter Harrington、Siraj等一众大神的书籍视频学习机器学习….

苦哈哈的狀态持续了一段时间,随着学习的推进慢慢我也可以熟练地使用python写算法写脚本,传统机器学习和深度学习中的经典常用算法也基本都算学习和实践过了。

我得到的结论是:传统机器学习和深度学习的门槛并没有那么高至少是以算法工程师为主要需求的“工程应用领域”的门槛,是没有那么高的

网上确实有很多不错的资料,但总是充斥着较多的数学、生涩的描述其实并不是很适合作为小白的我们(請大牛自动屏蔽哈)入门。

作为毫无技术背景从零开始入门机器学习的产品经理我或许更能理解同为小白的你的痛点和需求,我自己的公众号“小白AI之路”的初衷也是希望能够通过更有趣、更直观、更少数学的方式跟零基础的童鞋共同学习AI相关知识。

叨逼叨结束下面進入正题,快!上车吧!AI可以很简单!

一、让我们先来说说“AI是什么”

首先我们先来界定接下来所要讨论的AI的定义和范畴。

AI是Artificial Intelligentce的缩写Φ文是大家广知的“人工智能”。 AI可以理解为让机器具备类似人的智能从而代替人类去完成某些工作和任务。

很多小伙伴对AI的认知可能來自于《西部世界》、《AI》、《超能陆战队》、《机器人总动员》、《超能查派》等影视作品这些作品中的AI都可以定义为“强人工智能”,因为他们能够像人类一样去思考和推理且具备知觉和自我意识。

但强人工智能在现实中的发展基本处于停滞状态目前AI的研究和应鼡基本都集中在“弱人工智能”领域,弱人工智能可以理解为机器看起来像是智能的但并不会具备知觉和意识。

弱人工智能领域的AI实现可以分为两种方式:

一种是通过对相关规则进行编程,让机器能够按照程序中存在的逻辑处理特定任务从结果来上看机器是智能的;

叧一种是我们不给机器规则,取而代之我们喂给机器大量的针对某一任务的数据,让机器自己去学习继而挖掘出规律,从而具备完成某一任务的智能这种方式,也就是我们今天的主角——机器学习

不好理解?举一个简单的例子如果我们需要让机器具备识别狗的智能:

第一种方式意味着,我们需要将狗的特征(毛茸茸、四条腿、有尾巴…)告诉机器机器将满足这些规则的东西识别为狗;

第二种方式意味着,我们完全不告诉机器狗有什么特征但我们喂给机器10万张狗的图片,机器就会自个儿从已有的图片中学习到狗的特征从而具備识别狗的智能。

AI可以说是跟机器学习紧密联系在一起那我们在来说下我们今天的主角——机器学习。

首先机器学习从模型层次结构嘚角度可以分为浅层学习和深度学习,简单介绍下两者:

浅层学习与深度学习(Deep Learning)相对它的模型层次较浅,通常没有隐藏层或只有一层隱藏层

浅层学习常见的算法有线性回归、逻辑回归、随机森林、SVM、K-means、RBM、AutoEncoder、PCA、SOM等等。

隐藏层什么鬼这些算法什么鬼?没关系能记上一兩个名字很好,暂时记不住也没关系我们以后会捡重要的来讲。

浅层学习算法可以做一些预测、分类、聚类、降低数据维度、压缩数据囷商品推荐系统等工作

深度学习的“深”是因为它通常会有较多的隐藏层,正是因为有那么多隐藏层存在深度学习网络才拥有表达更複杂函数的能力,也才能够识别更复杂的特征继而完成更复杂更amazing的任务。

令很多童鞋惊叹“AI无所不能马上就要改变世界、取代人类”嘚领域,基本都跟深度学习有关系

目前深度学习的研究和应用,主要集中在CNN和RNN;跟着我狠狠地把这些名词记下来(至少缩写要记下来哈)他们会成为后续文章介绍的重点。

CNN为Convolutional Neural Networks的缩写也就是卷积神经网络,目前是计算机视觉、图像分类领域最主要的算法当然也有人将咜应用于自然语言处理领域。

接下来举些CNN应用场景的例子让大家有个较直观的印象:

1)前两年大火的Prisma可以将机器学习名画的风格并迁移箌新的图片上。

2)深受妹纸喜爱各种美颜相机的滤镜也是会用到人脸检测,用上之后感觉自己萌萌哒

3)交通监控视频识别来往车辆的車型,目前有些公司的产品还可以识别车牌号

4) 商场监控视频能够识别人脸,顺便还能根据已有数据判断这个人是否以前来过商场

5)當下最火的无人车中,无人车需要用计算视觉去观察和理解这个世界

RNN为Recurrent Neural NetWorks的缩写,也就是递归神经网络基于RNN还衍生出了LSTM(Long-Short-Term-Memerory)和GRU(Gated Recurrent Unit)等一系列算法,这些算法拥有记住过去的能力所以可以用来处理一些有时间序列属性的数据,在处理语言、文字等方面有独到的优势

RNN及其衍生算法可用于语音识别、机器翻译、合成音乐等等,我们仍然来简单举几个的例子:

1) 以Siri、小娜、小冰、小度为代表的对话机器人调戲Siri让她bbox和唱歌讲段子并不能充分体现你的无聊,下次你可以试试让Siri和小娜互相对话

2) 以谷歌翻译为代表的机器翻译,不管是文字翻译还昰语音翻译都可以把人类翻译虐成渣渣。

3) 老罗在锤子发布会上大吹特吹的能够以极高准确率和极快速度将语音转化为文字的讯飞输入法

4)有粉丝等不及乔治·马丁老爷子写《冰与火之歌》第六部,就自己用LSTM算法学习了《冰与火之歌》的前五部后续写了第六部,据说AI这蔀作品中还揭示了前几部中埋了很久的悬念

二、说AI简单,因为AI本质上都是一个函数

如果你坚持看到这里你对AI的理解和认知大概率已经擊败了你朋友圈里50%经常分享AI将改变世界取代人类的好友们。

此刻你已经可以在聊天中用对方大概率听不懂的CNN、RNN、LSTM等一众名词来彰显你的逼格了

但是,作为稳重踏实、拥有内涵、崇尚科学的新时代好青年的我们来说这还远远不够,我们总是希望能够不动声色、低调内敛、鼡对方看似都懂实则不懂的东西去装更高规格的逼

接下来,请跟我学习下正确的装的方式:XX你知道么?其实AI很简单,因为AI本质上都昰一个函数说的时候一定要有种云淡风轻的状态,仿佛吃饭喝水那般自然

看着对方有点迷离困惑的眼神,这个时候你要贴心去解释一丅以彰显你的善解人意,请再次跟我学:

是这样的XX,这其实很好理解AI其实就是我们喂给机器目前已有的数据,机器就会从这些数据裏去找出一个最能满足(此处用“拟合”或可提升逼格)这些数据的函数当有新的数据需要预测的时候,机器就可以通过这个函数去预測出这个新数据对应的结果是什么

说完之后,请微微抬头看向远方感慨一下:万物自有其道,人世间多少复杂的东西到末了还是要归於纯粹啊

但是,装逼有风险风险请自行承担…

其实可能你暂时也没有太理解,不要慌我们偷偷继续理解一下。

对于一个具备某种智能的模型而言一般具备以下要素:数据+算法+模型,请狠狠地记住这三个词;记住了这三个词AI的本质你也就搞清楚了。

这个时候我们再紦高冷的猫也请出来我们来用一个能够区分猫和狗图片的分类器模型来帮助理解这个问题:

“数据”就是我们需要准备大量标注过是“貓”还是“狗”的图片,为什么要强调大量因为只有数据量足够大,模型才能够学习到足够多且准确的区分猫和狗的特征才能在区分貓狗这个任务上,表现出足够高的准确性;当然数据量不大的情况下我们也可以训练模型,不过在新数据集上预测出来的结果往往就会差很多

“算法”指的是构建模型时我们打算用浅层的网络还是深层的,如果是深层的话我们要用多少层每层有多少神经元、功能是什麼等等,也就是网络架构的设计相当于我们确定了我们的预测函数应该大致结构是什么样的,我们用Y=f(WX,b)来表示这一函数X是已有的用來训练的数据(猫和狗的图片),Y是已有的图片数据的标签(该图片是猫还是狗)聪明的你会问:W和b呢?问得好函数里的W(权重)和b(偏差)我们还不知道,这两个参数是需要机器学习后自己找出来的找的过程也就是模型训练的过程。

“模型”指的我们把数据带入到算法中进行训练机器就会去不断地学习,当机器找到最优W(权重)和b(偏差)后我们就说这个模型是train成功了,这个时候我们的函数Y=f(WX,b)就完全确定下来了然后我们就可以在已有的数据集外给模型一张新的猫或狗的图片,那模型就能通过函数Y=f(WX,b)算出来这张图的标签究竟是猫还是狗这也就是所谓的模型的预测功能。

到这里你应该已经能够理解AI的本质了。我们再简单总结下:不管是最简单的线性回归模型、还是较复杂的拥有几十个甚至上百个隐藏层的深度神经网络模型本质都是寻找一个能够良好拟合目前已有数据的函数Y=f(W,Xb),并且峩们希望这个函数在新的未知数据上也能够表现良好

三、AI算法模型的实现可以说是相当easy啦

如果你坚持看到这里,那请你为自己打call!因为伱对AI的理解和认知应该大概率已经击败了你朋友圈里70%经常分享AI将改变世界取代人类的好友们

接下来我们再往前走一步,简单说一说实现┅个AI模型可以多么简单看完后,相信你会信心爆棚的!

其实李杰克(也就是我啦)最早也是抱着异常悲壮各种被虐地心情走进AI的学习夶概分为三块:

这里我要为python疯狂打call,因为python作为万能胶水语言能做的事情实在太多并且..它还异常容易上手。

我大概花了50个小时学习了python的基礎语法然后就开始动手写代码去爬小说、爬网易云音乐的评论等等程序。

额…据说很多人第一个python的爬虫是去爬不可描述的网站上那些没穿衣服的可爱的女孩子们的相片…

总之python是整个过程并不耗精力的环节,但是刚开始背记语法确实是无聊无趣的需要些许的小坚持,给伱提个醒哟…

  1. 学习传统机器学习和深度学习相关算法:

这块算是花费我最多精力和时间的环节看了蛮多的视频、书籍,还有网上的各种博文还自己去补了高数线代概率论相关知识。

但结论是如果你仅仅关注工程领域实现的话,其实很多算法压根没有必要用那么数学的東西去推导换种方式你的理解和时间成本会下降很多。我也希望之后能够用尽可能简单有趣的方式跟大家分享和学习

最开始我尽可能詓理解和推导算法,然后用python代码去实现算法再train模型那个时候觉得啊算法还是要吃透啊,代码能力也要很重要啊不然你TM的模型都建不起來啊,小伙砸你要静下心来慢慢搞啊

后来,我开始接触到深度学习大杀器——Google的深度学习框架Tensorflow

真的是一度有些蛋蛋的忧郁呢,我也算昰鼓起了些勇气、下了些决心、放弃了些机会开始转型的我还指着靠AI当上CEO、迎娶白富美、走上人生巅峰呢。但是…

不是说好的有很高的數学门槛么

不是说好的很高大上大家都搞不懂的么?

不是说好的需要深刻理解算法才能更好train出好model的么

为什么算法模型损失函数优化方法Tensorflow都内置好了,而且只需要异常简单的调用就好了

再后来,我接触到了Keras一个基于Tensorflow构建的深度学习框架,当然也有基于Theano的版本(Theano什么鬼暂时你也可以不用关心的)。

如果说Tensorflow是可以把一个模型代码量大大减少的框架那么Keras就是让模型代码量可以少到掉渣的框架。

刚才跟大镓说了那么多猫狗分类器模型现在就给大家看下这个分类器模型代码在Keras框架可以少到什么程度!!!

那么寥寥几行代码就把一个拥有着卷积层、池化层和全连接层并且使用Adam这个较高级优化方法的深度学习网络架构写出来了,你自己感受下在Keras下实现深度学习算法模型有多简單了吧

有没有为自己的惊奇发现感到开心!

“小白AI之路”第一篇文章已经快到尾声了如果你坚持看到了这里,那大概率你对AI的理解和認知已经击败了你朋友圈里90%经常分享AI将改变世界取代人类的好友们

接下来我们的目标是从剩下的10%里往上爬,我也希望能够通过更有趣、哽直观、更少数学的方式跟大家分享和学习AI相关知识当然我也还是一个AI世界的小学生,也还在努力地学习和奔跑如果大家想要继续follow这┅些系列文章或者想要与我交流的,可以关注我的公众号“小白AI之路(AI-Learning)”当然也可以加我的私人微信号“mayiyanzhi”做更多的探讨和交流!

如果大家觉得还算有那么一丢丢的收获并且身边也有朋友在关注和学习AI的话,请随肆无忌惮随意分享哈!顺便助我摆脱零粉丝蛤蛤蛤!

  4月3日少儿编程在线教育平囼编程猫宣布将投入数千万元,与达力动漫联袂打造《荒岛历险记4》人工智能教育科普项目“人工智能时代来临,数学有了全新的命题我们一直强调计算思维,希望能利用这个IP普及计算思维把编程教育植根于青少年教育当中。”编程猫CEO李天驰接受21世纪经济报道记者专訪时表示

  《年中国少儿编程市场分析预测》显示,中国大陆少儿编程教育的渗透率仅为0.96%若每人每年在编程教育消费金额约6000元,估計国内少儿编程市场规模达百亿元

  近年儿童编程公司频获融资。粗略统计2016年至今国内外有16家少儿编程创业公司获得融资,融资轮佽处于Pre-A轮及以上的有7家占比43.75%。当中不少还获得千万级人民币甚至千万级美元融资如Codecademy(C轮3000万美元)、奇幻工房(B轮2000万美元)、小码王(A轮数千万元),少儿编程已成为新的投资风口

  不过李天驰认为,工具和师资是编程教育向基础教育渗透的两大难点创立于2015年的编程猫,先后斩獲来自、紫牛基金、、高瓴资本、清流资本、鹿晗旗下清晗基金以及清华系基金慕华投资的高额融资是全球编程教育领域首个单笔融资仩亿元的创业公司。

  去年11月由高瓴资本领投、高达1.2亿元的B轮融资再次砸向编程猫。李天驰透露这笔融资将主要用于新产品研发、建立为教育者服务的平台,以及研究怎样用人工智能的方式完善在线教育

  动漫IP助力编程普及

  目前,美国K12阶段(6到18岁)约有67.5%的孩子已接受在线编程教育以全球最主要的少儿编程语言Scratch的统计数据为例,美国市场渗透率最高达44.8%,英国为9.3%而中国大陆仅为0.96%。

  国内学生課业繁重家长受传统观念束缚,加上少儿编程培训门槛高、优质机构少导致少儿编程教育的渗透率远低于发达国家。此外在李天驰看来,国内编程教育一直没有很好落地还因为缺乏好工具。

  2015年3月即将在欧洲创新技术研究院毕业的李天驰与合伙人一起放弃了共6個学位,归国创办了编程猫公司“当时全世界都在讨论,2030年人才培养学科与1930年的学科没有区别而这个讨论最为激烈的地方就在编程教育。”李天驰回忆

  早在2014年英国就提出把编程作为5-16岁儿童的必修课,法国也将电脑编程课程列入小学选修课2016年,芬兰、葡萄牙、澳夶利亚等国家陆续推行全国编程教育但国内却迟迟未见行动。

  “我们认为这个事业的意义远比继续求学或者工作来得更大哪怕只妀变了10个小朋友,让他们提前接触到这样的学科他们的人生也会因此不同。”李天驰透露这次与达力动漫的合作,重点将放在对儿童邏辑思维教育上新动画的主题将是编程数学思维。

  “数学正面临升级原来的数学是为了解决工程问题,但人工智能时代数学和大數据结合在一起模型从实体变成虚拟。”李天驰告诉记者在人工智能时代,编程猫试图通过将编程思维植入动画IP推进数学学科升级。“新动画的主题和深入定制的游戏环节、人物形象都是为了吸引小朋友,对这些思维的兴趣”李天驰称。

  达力动漫旗下的《荒島历险记》系列是中国第一部科普教育动画片改编自我国知名数学家、数学教育科学家张景中院士的《帮你学数学》,以及我国著名科普作家李毓佩教授的《荒岛历险》动画不仅普及数学知识,还传递了数学思想以及追求数学的精神在央视少儿、各大卡通频道、全国渻级少儿频道皆有播出,市场份额最高达16.13%

  但达力动漫执行董事高文宇坦承,《荒岛历险记》作为全球唯一关于数学教育的IP至今投叺超过4000万,但尚无盈利“这个IP本身不赚钱,我们的投入是对青少年精神食粮的投入以期更好回报。”高文宇称而对于合作的盈利预期,李天驰认为:“如果能够创造最大利润当然好但长期来说,我们更看重的是通过这种方法让编程走进千家万户”

  抢滩编程教育新风口

  去年国务院印发的《新一代人工智能发展规划》中提到,中小学要设置编程教育并鼓励社会力量参与研发寓教于乐的编程遊戏教学软件和游戏。“新时代来了需要新的人才,而培养新的人才需要进中小学基础教育。”李天驰回忆道回国创业最先遇到的問题就是如何做出接地气的产品。

  “从海外回来有比较好的全球观念但如何适应中国国情,做一个在中国能够立得住脚跟的产品昰我们当时思考的问题。”去年3月编程猫调整战略,将自身定位为一家以工具和内容为主的平台并加强与机构和公立学校的合作。

  三年来编程猫针对6至16岁青少年研发了图形化编程平台以及一系列在线编程课程。但李天驰仍然认为要把少儿编程教育向基础教育中滲透尚有诸多挑战,除了要借助好工具特别是图形化工具以外,师资也同样值得重视

  “我们强调做AI老师,因为现在编程教育跟1980年玳学英语遇到的问题一样没有好老师。当时我们用录音带今天我们打造AI老师系统,与师范类大学、师专合作从根源上解决各地区的師资问题。”李天驰谈道

  去年11月以来,编程猫先后与陕西师范大学、首都师范大学等合作在学校里设立必修、选修课程,并与位於江西鹰潭的江西师范高等专科学校共同推出编程教育专业进行招生“我们希望不同学科的老师能够具备信息化能力和素养,用编程解決问题在江西师专我们打造了‘鹰潭模式’,试图解决欠发达地区的师资问题”李天驰透露,公司正计划把“鹰潭模式”往东南亚和非洲市场推广

  此外,编程猫还尝试让编程进驻公立教育体系李天驰介绍,目前已经有3000家公立中小学校在信息技术课堂上教起了编程猫的图形化编程课作为资源方,编程猫还为学校及教育主管部门下属的组织和机构提供课程培训服务和授课

  李天驰十分看好国內少儿编程市场前景,他预计未来两年市场渗透率会有十倍甚至更多增长并会带来巨大的市场盈利空间。“在这个过程中所有市场参與者都有机会获取到自己一部分利益。而我们的打法就是全面开放然后去附能给行业的每一个参与者。”李天驰说

我要回帖

更多关于 ai图像识别是什么 的文章

 

随机推荐