股票科学:买入30天后的确定性
——股票:开启算法系统时代
作 者:《临界时空》顾海冰
❶问题的提出 与答案
伟大或愚蠢,起始于人能够问出什么样的问题。
今天买进,30日后卖出,能赚钱吗?
这,是个蠢的问题。
因为,没有人会问这种蠢问题。
假如存在这种情况,那些拥有资金、高科技算力的大拿们,岂不老早就搞出来了!
所以,这种情况不可能发生!
但,有一个人,并不这么认为。
因为,这个世界,某种认为的不可能,存在得久了,是会变成有可能的。
山羊都有上树的。
不仅要成为可能,还要满足成为系统的更高要求,那就是:
该算法信号,能作为趋势的先行指标、能进行选股……
先看股票的两大规律:显性规律(随机性会接纳更多的参与者,随机性的概率分布会吸引更多参与者。流动性是股价市场的第一需求)与隐性规律(决定操作结果):
接着看这个算法模型,如何选择出特定的时间点:
画个图演示,算法模型输出一个黄点坐标,纵向对应时间点,卖出,30日后收盘价买入(本文所指的单位日,均指实际交易日);横向对应价格,未来股价一旦与其相交,买入,30日后收盘价卖出。
先看结果:最近三年以及历史:
上图:上海深圳至今,做到平均每单5%左右收益,这是超14万次下单的单次收益率。22年-24年8月,最高近7%/单的收益,三年均值4.3%/单收益。还有,对于30日的周转期,实际收益还要乘上实际周转率……
还有,黄点的卖出策略,24年如以90日收盘价,可达收益13%/单:
一个策略,能赚钱就算了,还能买能卖,居然都能赚钱。
这你受得了吗?
❷故事的起点,来自于“一个事实”,与“一个假设”
人类的预测,本质是颅内结构对现实结构的模拟。一个人有近千亿的神经元,但,世上没有相同的神经元。这个世界的底层是差异性,能量转移来自于差异性。
同理,股票赚钱符合该规律,来自于差异性。经济并不是钱,而是钱的流动,流动性亦来自于差异性。
差异性演绎出复杂性,带出“一个事实”:随机性,对世界上事件现象的统计,会呈现出随机性。
想仅通过现象样本数据统计,就能指望发现真理的时代,随算力的发展,在上世纪八十年代已告终结:
世界有终极真理吗?——有,且终极真理就是“随机”。这句话,是对统计时代的总结。
因为暴力统计的败局,人们理解到,需要穿透现象,找寻更深刻的原因,才可能找到想要的东西:确定性。这也是打那时起AI开始抬头的原因。
股价也是同样的。以股价现象为基础的——K线、均线、MACD、KDJ等各种指标,都是以股价现象作为样本集的一个统计。需要理解的是,任何统计不可能改变样本集本身的属性。股价是随机属性的,那么以股价、及其演绎出的K线、各种固定周期指标为基础的策略,其统计结果必呈现出随机性。一个二分的传统指标策略,其统计结果必定是五五开,让人感觉,趋向均衡是必然。
但,明显,市场的结果,是二八开的。显然,在现象这样的样本集上,费劲去统计,是无法解释实际结果的。
那么这些指标发明时,难道不知道这个事实?
我们将那个时代定义为“低算力时代”,人是靠眼睛,观察图形来寻找规律的。概率分布以及选择性偏差的存在(如一本传统理论书里,选择的是成功案例为主),使得即便在π这样的随机数中,人也可以找出某种规律。
但上世纪80年代以来,随算力的提升,统计进入到“大数据量样本”时代后,随机性就成为被普遍认可的统计事实。
只是,路径依赖的存在,使得大量使用者不愿去相信。
很简单,如果仅靠穷举法暴力统计股价,就可以得到优秀的答案,那巴菲特是不可能存在的了。
这是AI目前还不能做到预测股票的根本原因:样本不对啊。使用随机性的样本集,越暴力,越是随机性!
算法前提假设的重要性
但,事物都会有内在规律。股价除了随机性属性外,必定存在其他的内在规律。
股价系统是个自组织临界系统,如沙崩,影响结果输出的,是对于临界状态的判断。
人是为未来而生的。
渴望寻求面对未知的能力,这是刻在人的基因中的。
面对未知,人类采取的应对行为是试错,思想上是建立假设。
未知,是一种可能性。统计已发生过的可能性,是无法找到未知可能性的。未知的可能性,是在突破原有系统边界后诞生的,所以,处在以往数据集里的人们,只有通过“假设”去预测这种可能性的存在。
这就是那“一个假设”的重要性。
世界是这样,股价亦如此。
在进入“假设”前,我们需要先了解主要矛盾之间的关系:资金与股价。
先做极限条件下的思想实验,去观察临界值如何出现。假设市场资金与股票都是定值,那么资金与股价或市值,能达到什么程度?市场资金=市值?
假设有三人,各有股票数量为1,资金各有500:
那么股价,或市值,可以达到多少呢?
如果三人之间各以500价格,一次性分别买入他方手中股票,那么通过3次交易便无法再持续下去,因为谁都无法买入超过500的价格了:
无差异化,带来不可持续性。同质化之下,最终未可知,但谁先低卖,谁就先处于亏损的状态,谁就先处于事实不利的位置。
先处于不利的位置,一旦时间久了,结果尚不可知,但对个体声誉极具影响。
因此,大家可以理解,为什么对于热门的股票,基金经理一旦持有,是不敢轻易抛出的,因为一旦股价继续上涨,而该基金已抛出该股了,那么压力就会全部给到做出决策的基金经理头上。
同时,我们也可以理解,基金会产生羊群似的杀跌效应,因为当股价跌到一定程度时的卖出,会形成客观“不得不做的行为”,从而降低对个体能力水平的判断程度。
故,此心理状态下,大家会听到、强调股价“止损”的重要性(通过止盈止损,获得心理账户要求的确定性,是不可迭代的伪确定性,是纪律而非判断),是降低怪责至自我的教诲,满足的是股价在跌状态下,消除未来股价不确定的心理需求。有人坚持认为拍卖会出问题,因此,大家从没听过巴菲特提出股价跌多少要止损的要求。因为同样的价格付出,购买的,有人是价值(投资),有人是价差(投机),有人是情绪(消费)。(注:本文无意于对错的认定,只是从心理动机角度,去描述现象本身的心理性质,故有主观性。并不影响其客观重要性,也并不表示崇拜某人)
同理,对客观存在的股价波动,人们会有拟人化的描述:骗线、诱空、噪音等。
上图中,通过三人间不断交易抬高股价,资金+市值由初始的1530,直到无法继续交易时为止,资金+市值此时为6000。在资金不变的情况下,股票市值由初始的30直到4500。
小结:
①价格宽度:折叠是这个世界的真实结构,因为它满足系统信息量最大化的要求,这意味着更多的差异化交易,可能带来更高的价格。
以此推理,阻止交易多样化行为的结果(比如停板),会导致价格可能的高度大幅降低。
②上涨趋势改变的临界状态:甲乙丙三人手中资金+市值的变化:
最终,至交易不可继续时,乙占到资金+市值总值的一半。
理解下来,交易不可持续的临界状态,就是满仓持有股票的一方,占到市值的大多数,而重点是:持有资金的一方,无力再兑现股票的盈利。
这是股价变化趋势的“根子”。因此作为“一个假设”的基础,就是判断市场资金兑现股票盈利的能力,并努力去量化这个兑现能力的“度”。
假设 及计算公式
我们假设“有效”(该有效,属主观认定)突破P价格,符合条件X:通过Q成交量能够消化浮动筹码,回调获得价格P的支撑。
我们采取极限思考:假设股价突破P后,只在理想价格P’点成交,等式为:
等式意味着M就是满足条件X的数值,我们设M为此模型中的一个定值。
假设价格在t点突破P,在t+1点成交于P’, P’-P=△P
那么等式则为:
当设定M为定值,等式成立时,此时时间共振点G点可确定,也就是黄点的时间轴坐标;起算点P点可确定,也就是黄点的价格轴坐标。
并可得结论:当成交量Q越大时,△P越小,两者呈反比关系。
当我们加入成交量Q这个变量后,所以箱体的突破高度△P为因变量,不再是理想等比。这也符合现实情况:箱体的 突破并非等比。
显然,长牛股符合这一要求,上涨中途不需要很大量,反而上涨的高度更高(美股、港股中长牛股的特点)。
M为是否形成“有效”突破的标准,回答了“够还是不够”的问题。
现实中,Q的分布不可能平均分布:
由此得出以下计算公式:
在这个公式中,因为M是已知定值,P是起算点,为历史某一时刻的取值点,成交量Qn值与价格Pn值乘积一旦发生便不会改变。所以当等式成立时的共振时间点G点,便是一个确定时点值,对应的价格P值是一个确定价格值。
算法的首要原则,或标准,就是不得有未来函数,必须且只能使用左侧数据,信号一旦出现就不会再变。可回溯(现在计算,与截去信号点后的历史数据,重新计算,该信号不变)。拟合是伪指标。会改变历史信号的指标,都是伪指标。
算法结果的统计
上图是1995年以来每单收益分布的散点图。这一个随机属性的正态分布,是如何做到每单近5个点收益的呢?
在±20的收益率范围内,亏损单与盈利单差异不大,而在±20范围之外的收益差值,是利润的重要区间。
上图是2024年初至2024年8月的每单收益率散点图。同样利润来自于±20范围之外的正差值(除±20之外的黄柱外,其他对应各色,对应不同区间的收益)。
可以理解为:在±20范围之内的单子,显现出五五开的随机属性。显然,该范围内,短期被人为控制的可能性更高。
❸能成为算法系统的重点:市场趋势的先行指标
一个算法可以成为交易策略,但能否自成系统,关键点在与能否对市场趋势,进行辅助判断。
算法被称为“黑箱”,但“黑箱”如果不被理解,则无法做出市场趋势的判断。
在低可解释区,就算准确性高,人也难以坚持,因为人操作股票,需要信念,可接受的信念,才可以让人保持坚持。
作为系统,首选图中的“选择区”,因为具有较好的“可解释性”。
黄点算法对趋势的可解释性
黄点算法,是描述市场资金兑现股票盈利能力的一个“度”。
上涨趋势的起始,是市场资金兑现盈利能力最强的时候。随着股价的不断上涨,兑现盈利能力不断降低,直至无力兑现,趋势转为下跌。
大型头部的形成,是因为价格上涨的盈利兑现能力已至衰竭。
看下图:
自2004年以来,按月计,个股黄点出现数量(图中红实线),与上证指数(图中灰虚线)每月最高最低价线的折线图:
分别看细部:
上图是2003年至2012年8月黄点出现数量(红线)与上证指数的关系图。黄色箭头所指位置,均是行情启动初期,红线呈现突破其前期箱体的爆发阶段。随着上涨行情的发展,红线却依次走低,表示对股价的盈利兑现能力,逐步降低。
上图区间为2012年8月至2024年8月,期间包含2015年的股灾。2014年5月起,红线就持续上升,而此时股指尚未摆脱底部箱体。
2021年至今(2024年8月),红线走一个类下降直角三角形。黄绿色线代表的黄点相交的个数,处于躺底的状态。要出行情,红线首先须突破当前形态,否则就持续当前的趋势。
我们对2015年股灾,放在上图周线统计上,看红线与股指的关系。
黄点算法对选股的帮助
上节,我们阐述了黄点出现数量,与整体市场趋势的强相关性。那么对于个股趋势呢?
文章开头,我们看到每单收益率随着时间递增的情况。上图中,可以观察到随着时间的进行,收益率递增的情况。
有人会说,买入策略受益于股指长期来看会上涨的。那么,在黄点对于个股趋势的相关性上,我们用黄点卖出的策略来统计与观察。
上图是自2016年以来,按月统计以40日收盘价计的盈利单(30日数据亦包含图中,每个线段共由9点连成,依次是10-90日,起点是以卖出后第10个交易日收盘价计,第三个点就是30日收盘价计,线段末端就是90日收盘价计),共31129次黄点卖出。
自2016年以来,卖出盈利单的收益率图,只有在19年4-7月期间转亏过一次!
线段走势从左下向右上变化的,代表盈利收益率随时间而递增。
上图是自2016年以来,按月统计以40日收盘价计的亏损单,共15639次黄点卖出。
线段走势从左上向右下变化的,代表亏损率随时间而递增。自2016年以来,只有5次由亏转赢过。
以上两图,亏单、赢单的难转向性,说明黄点与不同个股趋势的强相关性:黄点出现时,是个股趋势的起点信号。
亏单、赢单的难转向性,也为我们选股提供了基础数据。
按黄点卖出的设计理论,赢单,代表该类股票集达到盈利兑现“度”后,无后续资金继续跟进,转而形成下跌趋势。亏单,则代表在短期回调后,后续资金继续跟进,推动出一个上涨趋势。
股价随机性对黄点算法的影响
黄点代表的是一个时间共振性,黄点可以这样出现,属合适的卖点:
也可能这样,在低点出现,易成买点:
还有各种可能性出现,呈现弱相关性:
或者,黄点出现是合适的卖点,但了结时间段的不同选择,会改变一个单子的盈亏状态:
又如:
A:利用黄点卖出盈亏分类统计,可辅助对股票集进行分类。毕竟,避开价格变化谈股票好坏,缺乏对股价系统的基础认识。
价值需要价格实现,价格需要他人认可并行动。好的公司,未必是好的股价。
局部来看,金融投资都需要做出旁氏骗局的逻辑判断:是否有足够多的人会以更高价格买入。长期来看,资产价值是价格的基石。
B:或,对了结期的长短,作不同选择的策略,这是对共性模型的迭代,从而获取超额利润的可能。
❹能成为算法系统的重点之二:可视性 与多样性
人对于图形的观察能力,远高于对数据的观察。因此,算法结果的可视性,为是否能形成系统的关键条件。
人的图形观察记忆量有限,短时记忆广度一般不超过4个信息组块,因此算法系统的可视化中,同级指标信号显示不超过4个为宜。
另外,算法的计算量,比低算力时代的传统分析系统(目前所有的分析系统)算量,超千倍,已不存在本地运算的可能了。这是算法系统高效提供可视化的难度之一。
算法多样性,指不同的理论假设,可以得到不同的可视结果,换言之,算法具迭代潜力,如下图是对共振时间点G点,不同的算法可视图:
下图是不同算法下对股价高点的覆盖度,除❶处高点外,两种对共振点G点的算法(上部分图中黄点——下部分图中蓝点),与股价实际的高点或盘整点,基本全面覆盖:
多样性还包括可计算多品种,期货、汇率、*币等(只要是投资类,均符合那一个假设):
❺最优回测系统的要求标准
① 对历史数据要求
不提供流动性的交易数据需剔除:如大宗交易。
②对除权要求
股价除权后,会与股价其时(除权实际发生时点)发生的实际百分比有差异。
送股、缩股是乘除法,但当除权股价低到分角,取两位小数时,百分比变化会改变。
绝对性变化:分红除权,税收会对股价真实百分比产生绝对性影响。分红除权是减法,故,前复权不能用于回测。
举例比较:
采取前复权的模式直接计算,股价实际上涨20%,变成复权后的25%。
所以,股价回测只能采取后复权模式:
并且,回测的最优方案:是以不除权历史数据为基础,仅在回测涉及到的股价期间,按权息,做局部的单次除权除息,而非全域除权,然后再进行后复权,进行历史场景完全复原。此时的回测结果与其时实际交易的差异,仅仅在分红税收这个绝对性差异上,可忽略。
本文提供的所有统计数据,均是按最优回测方案进行的计算。
③对权息数据的要求
对于不针对流通股东进行的历史权息数据,全部剔除。包括且不限于,因债务重组、国有股流通等原因,仅在大股东或之间发生的送股、缩股权息。
❻算法系统具有的绝对优势:操作难以复制+保持随机性→对股票市场的深度思考
确定性与复杂性
股价系统,是一个自组织临界系统,作为混沌组织,具自指性。
当系统产生出某个确定性后,对该确定性使用的人越多,各种可能性就会发生,复杂性也随之而来,信息量不断增大。有点像熵增的必然性,当系统涌现出某种有序性后,随之而来的就是不断复杂化,复杂化导致不确定性增加,以及该部分利润的衰灭。
当前股票市场,在各项服务因素趋同质化的环境里,在个体正反馈作用下,会涌向更具差异性要求的资源控制权竞争中,形成泡沫。这是导致除去资源控制费外,全链丧失市场效率的原因,无论在市场资源配置上、流动性能力上、还是市场信心上。
要说明“同质化灾难”这个问题,我们用中国足球举例。
系统演化存在下图两种“演化模式”:
①输赢模式:以输赢为奖惩机制的外求模式,属被动型自然演化模式。自然演化的实际功能主打的是“淘汰”,而非决定谁能成为“赢家”的标准。
首先,尽管动物界奉行以输赢作为演化标准的丛林法则(人的动物性存在),但现实是,能延续下来的物种,从来不会是演化片段中的最强者,如灭绝的奇虾、霸王龙等。
回望人类的历代祖先,从来不曾是最强大的那位,而始终是为生存所迫,逐步演化出超级预测、适应力的那一位“柔弱者”。
演化,并不能主动选择改变基因,而是在足够数量的突变后,被环境淘汰掉大部分,而未被淘汰掉的那些基因,就是演化结果。
人类的演化,是大脑的演化。构筑千亿级别的神经元的组织结构,从而在不可控的突变之外,增加了学习这种演化的能力。
演化,做不到“都要”。没有演化出长着蜻蜓翅膀、猎豹四肢、人的大脑的物种。演化的内涵,是生存环境。每个物种都需要与环境,不断互动,因为生命必须能量交换。
需要,就意味着互相制约。这就是系统给予的负反馈,这个系统,就是构成环境的所有因素的综合体。
所以说,历史悠久的输赢模式下的演化,就是不断地变变变,再不断地淘汰淘汰淘汰。
所谓胜利者,就是经过系统的考验,能持续生存下去的。可以说,我们每一位,都是演化过程的一个胜利者。
成为人的标志,则是“不关心结果、只关心关系”的“因果预测”能力的产生。这是在本能预测之外的能力(本能预测包括四项:情绪、动机、经验、逻辑能力)。
正是这种追求“不实用”与“不真实”的能力,更好地形成了知识,以代表任何符合该关系的事物。
其次,树懒依旧生存,来自于生态位的差异化。巴菲特,不就是股票界耗能很低,不求快速运动的树懒吗?
“输赢”模式下,消灭同生态位的对手(其之间竞争在于限制数量,也会引向多样性变化)或下游食物端,是系统崩溃的直接原因,等于触碰到自指系统的反噬临界阈值,也就等同于自己消灭了自己。
强大如曾数亿年称霸地球,有无限资源优势的蓝绿菌,就被自己的排泄物“氧气”,淹没致死至无氧生命大灭绝。
这是生命演化系统中,在生命个体必然的正反馈机制下,引发强同质化系统崩溃的“同质化灾难”临界状态。
需强调的是,自然界的“输赢模式”只需判定输赢规则的公平性,而非决定“赢家”的个体标准。
自然演化外,人类社会演变出另一个“输赢模式”:成功者模式。
什么定义了成功者?是人的动机。
定义一种美,选择出百里挑一的模式,就可以挑起99个人的欲望,这样就可以赚99个人的钱。
定义一种成功,选择出万里挑一的模式,就可以挑起9999个人的欲望,这样就可以让大部分人
②热爱模式:人类特有的内求模式,属主动型模式。内心感受到的热爱,更能坚持、更能专注地去追求个人认为的更好。其功能主打的是“多样性”,只有个体放弃的选择,而非决定谁会被“淘汰”。
这个模式下的隐性市场,看似是“不实用”的追求,却占剧着整个市场的绝大部分比例。如果这个市场太小,那对应的输赢模式显性市场也无力做大。
人类社会系统的两套演化模式,是并行发生的。两者演化速度的不匹配,会产生失衡。
热爱模式有余,输赢模式不足,则市场竞争力弱,底大头小,效率堪忧(巴甲与西甲);
热爱模式不足,输赢模式过强,则失去可持续性,底小头大,缺乏系统发展必要的稳定性(中国足球);
“求存”的输赢模式,会导致各种只以赢为目标的动物丛林行为。“输赢模式”下定义成功者的前提,就是仅占少数,所以该模式下输出的成功者,也必然只会是少数。
“求真”的热爱模式,是内求下对自我真实性的追求,热爱是自然的选择,为热爱的付出,是心甘情愿,具更高专注度。由自我定义成功目标,为自我实现者。
如:6岁的郑钦文,选择了网球;11岁的她,看到李娜夺冠,树立起自己热爱的目标。这是榜样的力量,“她行,我也要行”。
如:更多的人,感受到善的力量,从而选择了给予善。这是信念。
如:少数人,在求存输赢模式中的“恶”,与求真过程中的“善”并存,是“都要”。但内心的“不一致性”。会产生失衡。
足球的问题,来自于两种模式发展的不均衡。
足球,股票,都是我国学习引进的市场,而非由真实需要,自发演化形成的市场系统。这种天生的缺陷,导致“热爱模式”演化的弱势,而“输赢模式”的规模发展则快得多。
想一想,离开比赛的输赢,足球却不是多数人的真实需要——因自我“热爱”而坚持足球运动的“基础”性底座。缺乏“热爱”模式下的多样化发展,就会导致输赢模式下的显性市场缺乏弹性,是“头大底小”的倒金字塔不稳定结构。各种问题,包括各类标准、专业训练、发展路径、战术素养等等,全链都会是问题。
学习,需要从底层的“热爱”开始。
一位脊柱侧弯、天生功能性扁平足、科学上根本不适合短跑的人,却成为迄今为止最伟大的短跑选手。
没错,他就是博尔特。
“热爱”模式是以个体成长需要作为基石的真市场,是隐性的基础市场。而“输赢”模式则是市场“催化剂”。
当“热爱”的基数够大,“输赢”模式下的标准、路径等才会越丰富,越丰富意味着被人为控制的可能性越低。
人类追求确定性,控制欲是本能的需求。但一旦形成强同质化,绝对控制就形成“黑洞”,黑暗会控制其中个体的内心。
反者,道之动。
“输赢模式”产生更高效率化,“热爱模式”产生信息量最大化。这是系统能持续发展的双重需要。
股票市场,与足球市场,是同样的问题。
“热爱模式”下未能形成模型的丰富性,那么“输赢模式”下的同质化就必然出现。同质化竞争带来全链的失效,是必然的结果。
“分散投资”模型,能保持操作的随机性与多样性。
所以,迄今为止,只有“分散投资”保持成为最有效的实战理论。
而“算法系统”自身的多样性,恰能在“分散投资”基础上,迭代出更具实战性的理论模型。
算法系统依旧能保持操作的随机性,是重点
首先,算法有“黑箱”的特点(遇到复杂问题时,由于本能预测系统的不被检索,所以人对于自己大脑的认识,也是个“黑箱”),对于他人而言,就是“随机性”的存在,难复制,从而依旧能保持系统的差异性。
足够多的差异性、多样性,是系统能持续进行能量交换的前提。
其次,交易依旧能够保持随机性的原因,还在于可30日后了结,也可在28或35日操作。其可能性是存在的,关键在于自适应性操作成本的降低与效率提高的能力。
第三,算法本身的多样化发展。
30至90个交易日的操作周期,属于中偏短的周期,除能提供更多交易外(交易本身就存在资金流转的经济价值);亦可通过实战或模拟结果,构成对市场趋势判断的手段。
趋势判断,是对临界值的判断。资金对某只个股价格影响力的判断,让人难把握;但对分散的、有足够数量的股票池,资金影响力没那么显著的敏感性,是可持续观察的。
比如:
当开盘价收益率开始高于收盘价收益率时,往往是趋势开始转换的时期,转换期不会如个股那般敏感、短暂。
随波逐流,实则是随“我”逐流
生命,利用规律,朝自我动机的方向,转移能量
鱼,溯流而上,寻找亿年流传的繁衍之地
人,或顺流,或逆流
皆在此刻选择
热爱生活,只为明天出现一个更好的自己
哪怕一点点
因为,做到这一切的
只有
我