Page 1 of 1

聚类机器学习——一个出色的“终身设置”项目

Posted: Tue Dec 03, 2024 7:05 am
by shapanhhhjjjjk
通过聚类进行机器学习
在我上一篇机器学习彩票文章取得相对成功的背景下,我决定尝试另一个著名的国家彩票游戏“Set For Life” ,但这次使用聚类来采取不同的方法。

值得注意的是,机器学习用于寻找模式。如果某件事真的是随机的,那么就不会有任何真正的模式可以辨别。但我们仍然可以抱有希望,对吧?

在我们进一步开展集群项目之前,欢迎在 LinkedIn 上添加我

什么是聚类?
聚类是一种算法,可帮助确定某个元素是否属于特定类别。有几个很酷的技巧可以让你正确判断,我将在项目过程中详细介绍每个技巧。

获取和清理数据
不幸的是,获取数据并不像我希望的那么容易。我首先 马约特电子邮件列表 100000 个联系人线 访问的是“国家彩票”网站,但只能获得最近 3 个月的开奖数据。这还不够。不过,我确实在网站上找到了每一次开奖、使用的机器和使用的球组。所以我把所有数据都抓取下来,并将它们存储在 CSV 中以备将来使用。

一切并没有像这里展示的那样轻松到位。我需要弄清楚页面是如何构建的,才能获得我需要的数据。其中最困难的部分是获取数字,但要通过链接转到另一个页面,该页面包含球组和球机,以添加到同一行。

总的来说,网页抓取大约需要一分钟来获取所有内容并将所有内容转换为我需要的格式。

最后,我们爱......爱
如果说周六晚间娱乐节目的历史能教会我们什么,那就是我们喜欢看到其他人坠入爱河(也喜欢在游戏节目中赢得奖品,不过那是另一个故事了!)。从 80 年代和 90 年代的《相亲》到 21 世纪初的《带我出去》,我们喜欢为陌生人牵线搭桥,追随他们爱情的萌芽。

Image

目前电视上大量的其他约会节目进一步证明了这一点;从《名人约会》、《初次约会》、《一见钟情》到《赤裸裸的诱惑》(如果你还没看过最后一部,一定要去看看,感受一下纯粹的震撼效果),我们只是喜欢看别人坠入爱河(或赤身裸体,参见:《赤裸裸的诱惑》)。

从我们小时候看过的迪士尼电影的童话结局,到让我们愿意让两个主角克服逆境走到一起的青少年电影(我正在看《我恨你的十件事》),再到我们成年后喜欢的梦幻浪漫喜剧,无论我们年龄大小,我们都情不自禁地被展开的爱情故事所吸引。

虽然《爱情岛》中的情侣并非都能结婚生子,甚至有些人甚至在周末就结婚生子,但我们却对他们的旅程产生了浓厚的兴趣,整个夏天都沉迷其中。所以,如果你还没看过《爱情岛》,趁这个季节还有时间看,赶紧去看看吧,你(希望)能明白为什么这么受欢迎!