计算机前沿讲座讲座体会 下载本文

计算机前沿讲座报告

最近听了温州大学***博士讲的机器学习,那么用对这堂课的心得体会来总结对计算机前沿技术的学习。先来说一个笑话,我们知道机器学习的子学习是深度学习,深度学习有一种叫做对抗网络(GAN)。对抗网络(GAN)类似: - 孙悟空(Real data):我是孙悟空。 - 孙悟空:我是孙悟空。 - 如来(D net):你是真的。 - 如来:你是真的。 - 六耳猕猴(G net):我是孙悟空。 很多很多次以后...... - 如来:你是假的。 - 六耳猕猴:我是孙悟空。

- 如来:你是真的。

这就是机器学习,准确来说是最常见的一种,监督学习。最开始的几步是对于模型的训练,“多了”或“少了”可以理解为训练时的误差,模型根据误差调整自身参数,这就是机器学习里常用的反向传播(Backpropagation)的简单的解释。梯度下降涉及到算法,最终来提高机器处理问题的能力。

机器学习想做的事情,简单的说是要从资料中归纳出有用的规则。大数据说的是对大量的资料做分析,而人工智能说的是让机器看起来更聪明,两者都可以使用机器学习来做核心的工具。

一名程序员,最终将会遇到很多类型的顽固抵制逻辑的、程序的解决方案的问题。我的意思是,对于很多类问题,坐下来写出解决问题所需要的所有条件语句是既不可行也不划算的。我听到你的程序员大脑在大喊,“亵渎”。

这是真的,以每天的鉴别垃圾邮件问题为例,每当介绍机器学习时,它是一直被使用的例子。当一封邮件到来时,你将怎样写一个程序来过滤垃圾邮件,决定是将它放在垃圾箱还是收件箱中?你将可能开始收集一些实例并深入研究它们,你将寻找垃圾邮件和非垃圾邮件所特有的模式,你还将会考虑抽象出那些模式以便你的启发式学习将来能够应用到新案例之中。你将会忽视那些永远不会被看到的古怪邮件,你将能够轻松的提高准确率并为边界情况制定特殊的程序。你将反复多次的浏览邮件并抽象出新模式来改善做出的决策。

在那里有一个机器学习算法,所有这些事情都由程序员而不是电脑来完成。这种手动导出的硬编码系统将具有同程序员一样的、从数据中提取规则并将其实现的能力。这能够做到,但是它将花费太多的资源,而且会是一个持续的噩梦。

在垃圾/非垃圾邮件的例子中,经验E就是我们所收集的邮件,任务T是一个决策问题(也称为分类),它需要标记每一封邮件是否为垃圾邮件,并将其放入到正确的文件夹中。我们的性能度量将是一些类似于准确率之类的、介于0%-100%之间的一个百分比(正确决策数除以总的决策数再乘以100)。

准备这样一个决策程序的过程通常被称为训练,收集到的实例称为训练集,程序即为一个模型,一个把非垃圾邮件从垃圾邮件的分离出来的问题的模型。作为程序员,我们喜欢这个术语,一个模型具有特定的状态并且需要被保持,训练是一个执行一次的过程,也可能会根据需要重新运行,分类是待完成的任务。这些对我们来说都是有意义的。

我们能够看到上面定义中所用到的术语并不是很适合于程序员。从技术上来说,我们写的所有的程序都是一个自动化操作,因此,机器学习是自动化学习的这一说明是没有意义的。