编辑整理:整理来源:维基百科,浏览量:64,时间:2022-10-03 18:35:01
福彩3d数据采集分析系统开发,福彩3d数据分析图,福彩3D数据家彩网
小米导读
各位看官,咱买彩票的目标是盈利,但每期均盈利不现实,周期性盈利是否有可能。比如连续购买七次为一个周期(不一定每天购买),每次最多购买200注彩票,这样周期内最多投入2800元,只需命中三次即可盈利【3*1000-2800=200】元,在盈利的前提下允许4次投注不中,即最多有4次出错的机会,若出错的机会继续减少,盈利的空间则加大。
1、研究对象暂定【福彩3D】为研究对象。彩票的产品线非常多元化,分全国或地方发行,有数字彩、乐透彩等,比较出名的产品有【福彩双色球】、【体彩超级大乐透】和【足彩胜负彩】等。因【福彩3D】的规则相对简单,不像【足彩胜负彩】那样复杂,且原则上每天开奖,总共的可能性只有1000种,中奖率高,满足普通老百姓娱乐购彩的需求。同时也正因为【福彩3D】的群众基础比较好,所以互联网上此类网站非常多,网民的参与度也高,相关的各类数据既规整又丰富,为进一步的数据采集及统计分析奠定了基础。特别强调一点,本文所说的研究不重点关注彩票数据本身,优先考虑预测彩票的人和这些人的预测数据。
2、研究目标目标是盈利。本文主要想探讨,在一段时间内,购买福彩3D时充分采集各路大神的预测信息并加以统计分析,是否可以做到阶段性的稳定盈利。
3、研究背景及主要思路3.1、对网站显示的结构化预测数据进行专项采集
上表列举了本人经常关注的部分网站。这些网站的共同特点是,多设有福彩3D相关的预测版块,且这些版块的信息或直接或间接的集中体现了【专家、指标、指标值、指标值预测统计】这4个维度的结构化数据。通过爬虫技术或其他IT手段,能将站内的预测数据进行专项采集,现以“彩宝贝”网站为例进行解释说明。
上述截图是2019192期福彩3D开奖号码公布前,“彩宝贝”网站的用户在站内发布的各个常见指标的预测信息,涉及的指标有【独胆、双胆、三胆、五码组选、杀一码、杀二码、杀三码、定三跨度、定四和值、杀二和尾、包星两组、直选定位】。彩宝贝网站每期的福彩3D专栏会发布100多个专家用户对这12个指标的具体预测信息,这些信息经过数据处理后,可得到如下表格:
如果我们把彩宝贝网站2019年每一期福彩3D的预测数据积累下来,全部处理成相同的格式,会得到如下统计表格:
上述表格行列数据较多,不便在文中直接展示,有需要可微信联系我。通过该表,我们可以大胆的猜测,针对独胆指标,每期的100个专家用户猜中0个独胆的人数或猜中一个独胆的人数是不是稳定在一个范围?其他指标是不是可以依次类推?各个指标显然不是相互独立的,哪些指标是主要的,如何结合主要指标统一过滤?这些问题是数据采集本身回答不了的。
3.2、针对已采集的指标数据进行统计分析并执行“容错”过滤
上文中抛出了多个指标如何有效结合起来进行投注号码过滤的问题,现借鉴彩票软件行业中“容错”这种处理多个指标的方式进行尝试。
A、不设置容错
B、设置容错
从上面两个截图可以明显看出,1000注投注号码在【大数个数1-2个】、【奇数个数1-2个】、【质数个数1-2个】这三个指标条件作用下,是否允许容错,结果差异巨大。不设置容错,最终投注结果仅有486注,设置容错且仅允许错0-1个,最终投注结果有798注。假设当期的中奖号码是001,若不设置容错就被过滤掉了,设置了容错就被保留下来了,这也符合彩票容错的特征,即保证准确率的同时提升了投注注数。后者较前者更容易中奖,我们追求的是稳定,更应该采取后者这种设置容错的实现方式。但问题是,我们如何界定每个指标出错的范围呢?比如,我们为什么要在上述案例中设置大数的个数为1-2个,而不是2-3个呢?这一步暂时想到的是利用正态分布的"3σ原则"。
我们根据2019年的预测统计结果,得到【独胆中出0个人数、独胆中出1个人数、双胆中出0个人数、双胆中出1个人数、双胆中出2个人数】这5个指标列的均值和标准差,然后假定5个指标列的每个观测值X都必须满足不等式(u-δ《X《u+δ),最后统计每一期多少个不等式没有成立,据此得到下表:
上表简单演示了购买每一期彩票时,如果采用容错策略,如何界定每一个指标列的临界值,主要参考了正态分布的思想,但这种借鉴是否合适,是否有更好的方法,还有待探讨。绘制上表时没有检验每一个指标列是否满足正态分布,这也是不合适的。得到上表结果后主要是利用最后的【指标判断错误个数】这一列进行过滤,比如实际应用时,可以继续设定容错不等式【1《指标判断错误个数《3】。
4、当前的尝试及面临的主要困难4 .1、当前在软件开发上进行了尝试,初步掌握了数据采集、容错思想的实现
4.2、现在面临的主要困难是理论提升
对照研究目标,投注注数在350注左右命中率较高,但这样投注的成本也加大了,需要参考已有信息进一步压缩。实践过程中发现,单一的指标无法做到稳定过滤,那么多个指标如何综合利用,是否存在某种理论适用于这种多指标的处理场景?如果存在,阁下可否简要介绍一下这种理论,或者你有更好的思路,期待和你的交流。若对本人采集的彩宝贝网福彩3D预测汇总专栏各年份原始数据及统计结果感兴趣,可扫描下方的二维码关注公众号【老米玩儿3D】,并回复“附件下载”4个字即可获得相应资料的下载渠道。
福彩3d数据采集分析系统开发,福彩3d数据分析图,福彩3D数据家彩网
作者:整理来源:维基百科,时间:2022-10-03 18:35,浏览:65