机器学习的应⽤实例
摘⾃范明等译的(原著Ethem Alpaydin)《机器学习导论》第⼀章,参杂部分个⼈见解,不对之处欢迎指点学习机器学习,应⾸先知道它在实际⽣活中的应⽤具体有哪些,这样有利于进⼀步的原理学习。1 学习关联性
购物篮分析:即挖掘商品间的关联性,购买了商品X的⽤户有多⼤的可能性会购买商品Y,其中⽤户可进⼀步增加条件,如性别、年龄等
WEB链接:可以预估⽤户可能点击的链接,预先下载好,提⾼存取速度2 分类(监督学习)
信贷:根据客户信息,如收⼊、存款等对客户的申请计算风险,决定接受或拒绝该项申请。该项也可以看做学习关联性,即计算客户能偿还该贷款的可能性有多⼤
模式识别:光学字符识别,如⼿写体字符识别;⼈脸识别;医学诊断;语⾳识别知识抽取:发现规则,如争取信贷中低风险的客户离群点检测:发现不遵守规则的例外实例,如诈骗3 回归(监督学习)
预测⼆⼿车价格:输出是车的价格,是不可数的数据,⽽不是某⼏个可数的类别,这类问题视为回归。输⼊信息可以为品牌、车龄等机器⼈导航:如⾃动汽车导航,输⼊汽车上的传感器(如视频相机,GPS等)数据,输出车轮转动⾓度烘焙咖啡:输⼊温度、咖啡⾖等信息,测试消费者的满意度,从⽽确定咖啡的品质4 ⾮监督学习
监督学习中,可以提供输出的正确值,⽽⾮监督学习之有输⼊数据,⽬标是发现输⼊数据的规律,这在统计学中成为密度估计,密度估计⽅法之⼀便是:聚类聚类应⽤:
将公司相似的客户分派到相同的分组,建⽴客户的⾃然分组,从⽽对不同分组客户提供特定服务,或者可以发现“离群点”,开拓新市场
图像压缩:会丢失图像细节,但赢得存储和传送图像空间
⽣物信息:序列对⽐,聚类可以学习结构域,即蛋⽩质中反复出现的氨基酸序列,若将氨基酸类⽐为字母,则结构域是单词,蛋⽩质是句⼦,学习结构域就是挖掘句⼦中频繁出现的⼀串字母
5 增强学习
国际象棋:规则少,但每局包含⼤量移动,每种状态⼜都有⼤量可⾏的移动,即单个移动并不重要,只有能战胜对⼿的移动序列中的每⼀个移动才是好的
机器⼈导航和⾜球机器⼈都类似国际象棋,这类问题还包含不完整和不可靠信息,依赖设备能否输出完整的信息,所以机器⼈总是处于部分可观测状态,这种不确定性因素也因考虑在内