大文学

手机浏览器扫描二维码访问

本站弹窗广告每日仅弹出一次
尽可能不去影响用户体验
为了生存请广大读者理解

机器学习是“让机器从数据中长本事”的技术(第3页)

巧妇难为无米之炊,数据就是机器学习的“米”。

- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。

- 数据预处理:这步特别关键,就像淘米要去沙。包括:

- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。

- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。

- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。

2. 特征工程:给数据“化妆”,让模型看得更清楚

“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。

- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。

- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。

3. 模型训练:让机器“刷题涨本事”

选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。

- 训练过程中,得注意过拟合和欠拟合:

- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。

- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。

解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。

4. 模型评估:给机器“考试”打分

训练好的模型得测试一下准不准。常用的指标有:

- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。

热门小说推荐
战九天

战九天

战九天情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,战九天-北香南炉-小说旗免费提供战九天最新清爽干净的文字章节在线阅读和TXT下载。...

村花难嫁

村花难嫁

《村花难嫁》村花难嫁目录全文阅读,主角是林天跃付大夫小说章节完整质量高,包含结局、番外。?《村花难嫁(穿书)》作者:倾碧悠然文案:桃源村村长四十岁才生下了个宝贝闺女,自然是捧在手心好好娇养。胎穿成老来独女的纪桃,以为自己落进了福窝,长到十岁才知道自己太天真了。她的那个将她捧在手心的爹,偏偏挑中了重生文的男主做上门女婿,她又不是女主,这是要狗带的节奏?本文1vs1,架空,架得很空,请勿考据。内容...

步蟾宫

步蟾宫

步蟾宫作者:花朝六九文案:省流版:本质是一个受带着一群热血笨蛋or欢乐喜剧人拯救世界的群像故事。前期剧情有点慢热。完整的↓↓↓那天,沈扶玉只是照常出了个任务,回来后就被告知我们修真界要完蛋了,你得去拯救世界。沈扶玉:“……?”行。他收拾了一下包袱,正准备下山时,又被告知,你还得带几个帮手。他礼貌问道∶“请问都有谁呢?”答曰...

炙热的,温暖的

炙热的,温暖的

炙热的,温暖的情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,炙热的,温暖的-梦澜洲-小说旗免费提供炙热的,温暖的最新清爽干净的文字章节在线阅读和TXT下载。...

落魄药女养家日常

落魄药女养家日常

德医双馨的太医院院首肖太医,卷入了贵妃假孕一案被斩首。十二岁以上男丁流放,女眷和幼童得太后恩典回了祖籍蜀地。没想到一直得肖太医庇护的族人却将一群妇孺拒之门外,霸占她们的祖产并将其除族。一群养尊处优的妇孺要啥没啥,从不显山露水只爱看书捣药的肖春暖成了全家的顶梁柱。教家人学洗衣做饭保生存;教妹妹们挖野菜,炮制药材;教幼弟学经商练武术强身健体,三代不能科举也要学文识字;努力挣钱还要救济流放的亲人;祖母为春暖寻得一门亲事,结果族长之女还找上门来闹事。人善被人欺马善被人骑,老恨新仇一起算,肖春暖从来不是手软之人,文斗武斗都可以应战!...

掌间砂

掌间砂

掌间砂作者:三奇嘉会格简介:【斯文俊秀大司长】VS【深藏不漏包租婆】【破镜重圆】【双初恋】全世界我都可以放弃,唯你,是我掌心的一点朱砂痣。他归来时,已不是当年那个曾为她写下一整本公考宝典的小小办公室主任了,这些年平步青云,成为了一手缔造海晏河清的大司长。却不料横生波折,被贬回地方。别后多年,她依然平凡不闻。他说:小娴,哪怕...