您的位置 首页 股票配资

「智交易」浙商基金查晓磊对话华安证券严佳炜:AI技术如何投研应用?

「智交易」浙商基金查晓磊对话华安证券严佳炜:AI技术如何投研应用?

【浙商基金查肖磊与华安证券严家玮会谈:AI技术如何投资和应用?科学技术改变了生活的方方面面,包括金融目前,大数据和人工智能在投资和研究中的应用正在不断探索。金融科技如何带动投资价值?相关产品有哪些?组织结构有什么特点?获取和分析大数据面临哪些挑战?

嘉宾介绍:闫家伟,华安证券研究院金融工程总工、助理主任。10年工程研究经验何先后为、广发、方正工作,多年为新财富团队核心成员,全面覆盖定量研究和产品研究。

查肖磊,浙商基金智能股权投资部总经理,香港中文大学金融研究博士,深证储备领军人物,9年证券行业经验,其中5年公开发行管理经验;曾任老板博士后研究员、策略师、投资经理助理,现任浙商智能股权投资部总经理,投资决策委员会委员,负责浙商主动股权和量化投资的经理

科学技术改变了生活的方方面面,包括金融目前,大数据和人工智能在投资和研究中的应用正在不断探索。金融科技如何带动投资价值?相关产品有哪些?组织结构有什么特点?获取和分析大数据面临哪些挑战?对此,东方财富网邀请浙商智能股权投资部总经理查、华安证券研究院工程首席分析师严家伟做客《财富大咖秀》专栏,与大家分享精彩观点。

查肖磊在接受采访时表示,浙商基金,作为公募基金,的经理人,自上而下提出了技术驱动价值的公司愿景,通过技术手段帮助持有者做好投资管理、投资组合管理、设计相应的基金产品。数据是基础。目前已经建立了六个维度的数据体系,包括市场、舆论、支付、论坛、电子商务,最后是整个大和各个子行业。AI投资机器人的概念就是把问题拆分成几百个细分问题。除了研究人员之外,虚拟化机器人的小研究人员可能有数百人接受AI的训练,每个机器人的小研究人员都专注于一个小细分问题。

同时,严家玮认为,科技融入生活的趋势越来越明显。金融科技实际上是一个广义的概念。移动支付,区块链,及其在银行保险的应用,投资者的舆情分析,卖家分析师报告的情感分析,都可以算作金融科技的范畴。近年来,市场上出现了各种各样的高频量化,性能突出,规模不断扩大,包括一些在模型端使用大量人工智能算法的头部量化私募,这是量化2.0的时代。

以下是采访记录:

1)技术驱动的价值

严家玮:各位投资人,早上好。今天的主题是“投资的下一站:大数据和人工智能”,让我们与大家分享今天我们在金融科技领域的一些探索。先自我介绍一下。我是华安证券助理董事、金融工程首席研究员严家伟。今天,我们非常荣幸地邀请到浙商基金智能股权投资部总经理查博士。下面就科技的一些前沿领域,浙商在科技方面的一些成果,人工智能和大数据在投资研究方面的一些应用,浙商的相关产品序列,和大家一起讨论一下,首先请Chabo介绍一下你这边的整个团队,展示一下毕浙商的布局

查肖磊:好的,首先,向屏幕前的投资者和朋友们早上好。我是浙商智力资本投资部的查。今天,我也非常感谢有这个机会与华安证券工程总工程师严家玮交流。首先,浙商基金,作为一家公募公司的经理基金,提出了我们自己公司的愿景,这是由技术自上而下驱动的。所以无论自上而下还是自下而上,公司都强调科技手段的运用。这里主要的科技手段是大数据包括一些人工智能方法。帮助我们进行更好的投资管理和投资组合管理,包括设计相应的基金产品,然后将其提供给我们的持有者,这是公司在大战略层面上的愿景。具体来说,因为我们这边主要从事权益投资和产品管理,具体应用来说,从15年左右到现在可能需要5年左右,所以从大数据开始到后来的人工智能,其实在最终的产品应用中,其实是逐渐摸索出来的,相当于在产品管理的过程中逐渐有了一些自己的感受,或者说是一些个人的感受。包括并逐渐形成自己有特色的产品线,所以我们现在有浙商基金股权产品线,应该说每一条都和技术、人工智能有比较大的关系,我们现在大概有四条比较核心的产品线。

第一种是直接通过AI建立作品集。我们称之为AI驱动产品或者部分股票股权产品,第二条产品线是主动管理产品,但也就是说AI系统会有一个助手,或者通俗一点说是祝福,我们称之为AI辅助主动管理产品线。第三条产品线是我们的AI beta产品线,通过AI做指数增强的策略。第四条产品线是AI的产品线,使用多资产类别、跨类别资产配置、目标收益或部分绝对收益。基本上我们AI的框架内有四条产品线,所以这是对我们公司的一个大概介绍,包括产品。

严家玮:刚才,夏博向我们详细介绍了浙商基金在金融,科技方向的规划布局,以及相关的四条产品线。关于浙商基金,我也做了一些功课,得知浙商基金在人工智能和大数据领域的布局在国内资产管理行业相对较早。2015年,浙商基金确立了“技术驱动价值”的发展理念。让我们回到过去,想想2015年我们生活中的技术应用。当时,微信、支付宝等平台刚刚开始成长

规模的普及。因此,浙商基金能够在2015年就开始进行人工智能的布局,这在国内大资管的公司中还是走在时代前列的,非常具有前瞻性。

  那我们刚才聊的是浙商基金的情况,我也向各位投资者介绍一下华安证券的金融工程团队。华安证券作为一家总部位于安徽的上市券商,2020年在研究所尹沿技所长的带领下,搭建了完整的卖方研究团队,部门大力扩张卖方研究业务,力图打造成为卖方市场有影响力的新兴力量。我们研究所目前有70多名研究员,涵盖了几乎所有的研究领域。然后我这边主要是带队金融工程团队,目前组内一共4名成员,其中大部分有五年以上的卖方金融工程经验。

  我们金融工程团队的研究方向除了刚才提到的金融科技领域外,还包括以下几块,一块是传统量化研究,例如因子选股、行业轮动、择时等等,这方面的研究我们一直在做,一直在创新。第二块是基金产品研究,资管新规后,净值型标准化的基金在配置中的比例会越来越高,所以在基金研究这一块,我们有相当多的人力物力在进行布局,这是我们整个团队在研究上的情况。查博也不妨介绍一下,你这边手下团队、人员结构等。

  查晓磊:说到人员包括组织架构,确实浙商基金在我们整个刚才讲的科技驱动价值这样一个愿景下,我们在组织架构层面确实也做了自己的一些探索,其实最主要在我们权益部门,我们可能把传统的基金公司,比如有主动管理和量化投资两个部门其实在我们浙商基金内部是把他合二为一,所以我们不倾向把原有的部门和两个团队区分那么开,我们希望两个来自不同背景的,一方面是来自主动管理,大家去做公司研究,去做行业基本面研究,另外就是从我们原来做量化的研究到后来就是说涉及到AI方面金融科技方面的研究,就是把两边的人员结合起来,所以在组织架构上我们是一个大的权益部门。

  其实也是牢牢围绕着我们科技驱动价值,包括我说我们提出了我们自己的一个投资策略的体系,叫做AI+HI,希望把AI的优势和我们HI主动管理人的智慧的研究的优势相互结合起来,所以这个结合就要有一个组织架构方面的配合,两边可能我在有一些资产管理公司量化和主动管理某种意义上大家有种竞争的关系,在我们内部一定是相互赋能、相互融合的关系,所以在具体到团队人员,我们现在有大的权益部门,首先投研一体化,大概有20多个同事,里面大概有6个左右的同事涉及到量化,涉及到AI方面的,包括我们也从科技类公司,比如说之前在百度的向博士,之前在百度有比较长时间人工智能的经验,还有做量化研究的同事,另外还有十几个是主动管理研究员,包括主动管理的基金经理,大家在研究的专长、研究的擅长包括研究的领域是各有侧重的,但是对于我们产品输出来讲,我们希望把大家的不同方面的聪明才智,把不同方面的技能整合到一起,相互赋能、相互协作,体现到我们刚才讲的浙商基金四条产品线当中。

  2)AI技术在金融领域的应用

  严佳炜:我们可以看到浙商基金在金融科技方面的人员配置是非常优秀的,包括我了解到也有团队成员之前在BAT工作过,所以我觉得无论从人员配置还是战略布局,浙商基金在大数据人工智能领域做的还是非常有前瞻性的。

  既然大家现在对查博士的团队已经有了比较初步的了解,那我们就把话题切回到今天的主要议题金融科技这条主线上来。就我自己这几年的感受,国内科技领域的发展还是非常快的,特别是十年前,大家觉得科技和我们生活结合的程度就没有那么密切,但随着这几年的发展,科技处处融入生活的感受越来越明显,比如说,线上支付平台的渗入,我们现在人民币现钞支付的情景已经很少了,出门完全不需要带现钞,比如我们去超市,甚至盒马,以及一些线下便利店都开始做无人化的线上支付,取代传统的收银员等等。这种购物体验与情景,在十几年前,是完全无法想象的。我们现在只要携带一个手机,就能把生活环节中方方面面能够搞定。甚至包括政府的办事窗口,在疫情后也逐步转到了线上平台上,例如上海的一网通办,能够非常便捷的解决居民办事需求,而不用像之前那么繁琐。

  我另外再举个大数据应用的例子,大概一个多月前我去过外地省份,当时返沪后正好赶上浦东新区疫情,当时某天,就接到那个省份的防疫大数据办给我打来的一个电话,询问我的一些情况。可以看到,这是移动大数据在疫情的管控方面的应用。刚才我介绍的,都是大数据、金融科技在我们日常生活中应用的例子,想请教一下查博,在金融领域,您觉得科技有什么前沿的应用?

  查晓磊:这个我们自己确实也看过,就是整个行业里面,因为我们在做这个事情之前,我们对行业其实还是要有一个了解的,AI或者科技在金融领域的应用,有些金融子领域用到已经比较多了,有的相对已经比较成熟了,我们会把它分成三块,第一个其中是在大的金融领域,我们传统的一些业务上的流程改造或者效率的提升,比如说我们最早的像信用的定价,包括保险的定价,这其实用到一些大数据的分析会提升大家定价的准确性或者定价的差异化,就是我们在比如说我们打开手机,比如说网贷的平台,可能通过你日常的你刚才提到支付的一些数据的分析,甚至包括行程路径的分析,可能它综合对您数据定一个信用的价格,贷款的利率如果信用比较好,会给你比较低的利率,保险也是一样,通过各种数据的分析,可能开车每年要去交的车险,每年根据你驾驶的行为、驾驶的数据做出差异化保险方面的定价。这是第一块就是传统的业务。

  第二块就跟我们资产管理相关的,就是财富管理这块,就是在客户端现在也有很多用大数据合乎人工智能方法进行客户画像的分析,也是通过他日常的行为的数据,可能会从这个数据里面挖掘出他对风险的一些偏好,或者是本身的整体家庭或者个人财务的状况,会推送不同的财富管理的方案,比如说分析出来是风险偏好比较高,或者风险容忍度比较高,会挥一些比较激进的产品和策略给你,这其实也是有很多,包括传统的银行,包括我们现在新兴的互联网公司都有类似的产品。

  第三块就跟资产管理更加息息相关,就是在资产管理这个领域。说实话在整个大的金融领域谈到科技的应用,或者是AI具体方法应用,资产管理至少从我们自己的感受来讲,相对来说是相比金融其他子领域来说是比较慢一些的,原因其实也有多方面了,最核心的原因我们自己理解还是因为在整个大的金融行业里面,资产管理相对来说是比较复杂的一个环节,另外就是说,他复杂程度比较高,另外他牵涉的方方面面比较多,整个我们需要考虑的问题也比较多,所以AI和科技在这个资产管理这样一个子的领域应用的话,相对其他的金融领域是要略慢一些的,这也是我们目前浙商基金探索重要的方向,就是科技和AI在资产管理领域,在我们投资领域里面到底应该怎么去用,然后发挥科技的重要的力量。

  严佳炜:就我对金融科技的理解,它其实是一个非常广义的概念,刚才我们提到的移动支付,区块链,以及查博提到的在银行、保险中的应用,其实都可以算作是金融科技的范畴。该领域近几年海外也涌现了相当多的公司,例如比较有名的Kensho本质上是做财富管理领域投资者与产品之间适当性匹配的,dataminer则是专注于用实时AI技术监测风险的。对标国外的,国内也有众多排名前面的互联网公司,或多或少都在从事该方面的研究。

  我们自己这边,也有在做投资者的舆情分析,卖方分析师报告情感分析,等等,这些也能算金融科技的范畴。另外比较高科技的应用是,之前大家可能也听说过海外有公司做卫星数据分析,那我前一段时间看到国内也有公司做卫星数据分析,海外是卫星遥感数据的应用,例如看超市停车场车辆的数量判断超市零售销量,通过远洋货轮上面货物的数量,判断航运方面的情况。通过这些数据反映公司整体的经营状况,然后再映射到实际的投资中,这种应用就是比较前沿,得到的数据也相对更有前瞻性。

  查晓磊:有价值的数据,可能传统数据不是所有人都能拿到的,但是一旦有这样的数据,对一些关键的投资领域确实作用比较大的。

  3)大数据指导投资

  严佳炜:另外我想到一点,浙商基金的母公司集团方面应该有比较多的特色大数据,例如一些支付、舆情、电商等方面的数据。查博能否给我们介绍一下,您这边浙商基金比较有意思的大数据,或者说可以直接映射到投资领域的大数据,有哪些?

  查晓磊:数据确实是我们做这个事情所有的基础,相当于就是说,它是所有事情的原材料,有了这些数据我们才可能去做接下来的这种具体投资方面的分析,从数据来讲,其实在我们这个团队过去五年多的时间里面,我们可能大概前两年绝大多数的时间是花在整个数据体系的建设上面,所以在两年多的时间里我们建了六大维度大数据的体系,现在也有一种说法叫做另类数据,一个数据的体系。大概涵盖的维度就是刚才我们其中也提到了,当然首先这个维度是传统的,大家都有,我们叫做市场的数据,这里面可能主要包含了就是我每天看到市场交易的各种数据,包括我们上市公司公布的财务报表的数据,我们统称为市场的数据,另外五方面就是相对要花一些技术的手段,或者通过一些合作的方式获取这个数据,尤其是跟终端消费品相关的,很多渠道除了线下传统的渠道之外,也开始逐步转到线上,线上电商平台上的销售数据或者流水的数据,对一些消费品行业的景气把握相对比较前瞻,至少是可能会更加实时一点,这是电商的数据。

  另外我们还有舆情的数据,通过各种新闻媒体的报道,尤其是比如跟我们做财经媒体的报道,去度量市场的情绪和热度,除了总量层面可能还有具体的行业、具体的板块,涉及到具体的公司热情舆情上面体现也不一样。第四一块就是刚才你提到的支付的数据,这其实在国外也有相关的应用,比如通过一些合作的方式,一些信用卡的大家刷卡的流水然后去分析大家支付的行为、资金流向的行为,看一些行业景气的变化。第五点可能是论坛的数据,当然论坛除了刚才讲的跟舆情相关的不良情绪,更多发现一些微观的变化,有一些信息或者是微观的蛛丝马迹,可能在一些论坛里面可能就是通过自下而上的观察和筛选,社会大众的发的贴子里面可能回头路出一些比较重要的信息,因为有的大家可能表述日常生活当中观察到的事情,或者听到的一些事情,这些事情对于他来讲是不经意的信息,但对于投资者如果能够捕捉到比较关键的信息,可能相对于市场绝大多数的参与者来讲,会有一定的提前性。

  第六个来讲,它是更大类的我们叫做各个细分领域的数据,从量来讲不亚于前面五类的数据,我们讲细分行业其实是要落到特别特别细分的领域,这里面我们希望能够找到就是说,做这个行业和做这个实业的人员关注到的数据,这些数据可能不是资本市场特别关注的数据,但做实业做行业是一直关注这些数据,统称来讲是行业数据,但不同的行业需要不同的收集,具体挖下去数量级别也是挺可观的,基本上来讲就是六大数据维度,就是市场、舆情、支付、论坛、电商,包括最后整个大的各个细分行业的六大维度的数据体系。

  严佳炜:我们团队对大数据领域也有一些粗浅的研究,从我们的感受,传统数据,例如行情或者基本面数据指导投资的逻辑是较为直观的,比如一个基本面比较好的公司在二级市场就有较佳的表现,您刚才提到一些例如支付、电商数据,这种数据业内被称为非结构化的数据。这种非结构化的数据,它对投资的指导逻辑就没有那么通顺,研究员需要深入挖掘数据中潜在的逻辑,进一步映射到上市公司基本面上。大数据对于投资的指导意义,不像传统数据这么直观。

  另一方面,浙商基金早在2017年发行了“浙商大数据智选消费基金”,在这三年多基金产品的运行管理中,查博肯定也积累到非常多的如何运用大数据的经验,因此,查博能不能向我们分享一下,您刚才提到的大数据,对于指导投资的逻辑是否通顺,是否具有一定的前瞻性?

  查晓磊:是这样,确实通过你刚才提到的我们浙商大数据智选消费+的产品,因为它首先是偏消费行业的,所以在刚才你正好提的像电商、支付这两个数据上来讲,它的应用对接其实要更加直接一点,因为它能够观察到终端细分的消费行业景气度的变化,其实大的逻辑是这样的,我们一开始讲的像市场的数据、交易的数据,然后包括财务报表的数据,从基本面角度来讲,我们撇开其他数据,假设没有任何外部信息的情况下,其实我们唯一获得的对一个公司或者对一个行业来讲,就是看它每一个季度发布的财务报表,去看它过去一个季度到底公司的营收怎么样,获得多少利润,获得利润盈利能力是变强还是变弱,通过财务报表分析这样一个角度,当然这个是全市场投资者都可以去做,因为财务报表对每个人是公开的,对每个人都是公平的。

  如果从这个数据来讲,对于瞬息万变的资本市场来讲,在一个信息的时代等财务报表效率上就会偏慢一些,财务报表一个季度过去少则一个月,多则两个月、三个月,可能最多要将近4个月之后,才能够观察到这个财务报表的变化。碰到这样的问题,我们通过电商也好,或者是支付也好,实际上我们做的一个事情是在能够更加实时的对这个公司或者对这个行业能够把握它景气度的变化,进而去推导它或者是当期的财务报表是往好的方向变化还是往坏的方向变化。但是从数据分析角度来讲,不可能跟它最终的财务报表完全吻合,我们通过支付也好,电商也好,就是说大体上其实可以推导它变化的方向,相对于上一个季度我们通过比如电商的流水,或者通过大家支付的行为数据的变化,能够大体的判断这个行业它所应对的行业上个季度是变得更好还是更差,如果掌握这个信息相对来说就会有对于比如资本市场价格里面就会有一定的前瞻性和指导性,所以就是说我们更多相当于是在做这个事情。当然说支付和电商只是其中一个维度,我们还可以通过其他刚才讲各个细分行业的数据,包括我们所能挖掘到的一些比如说咱们券商研究所、各个行业大家草根调研的数据,都是可以通过数据的连接起来之后,能够发现一些前瞻,如果达不到前瞻能够实时同步,基本上从市场前瞻角度来讲也足够了,能够发现一些景气度、基本面层面微观的变化。这是我们日常使用最多的场景,总结来讲就是通过数据各种分析,实时同步能够刻画出一个公司或者是一个细分子行业在当前情况景气度变化的方向,首先来讲是在做这么一个事情。

  严佳炜:大数据应用的难点,一方面是大数据的获取,这块其实需要做很多前端的工作,比如如何把这些非结构化数据转化为结构化的,如何克服各种IT难关,甚至有些部分你可能还需要加入一些人为的处理判断,另外一个难点我认为就是如何理通数据与投资之间的联系,查博刚才已经给我们非常详细地介绍了,在消费领域,大数据如何指导投资。浙商基金在去年2019年发行了一个全行业的大数据基金产品,您能否介绍一下,其他的一些非消费类的行业,如何运用大数据指导投资?

  查晓磊:好,其实从我们做的顺序来讲,我们最早实际上是从周期和消费两个行业开始入手的,所以我们第一个产品浙商大数据智选消费也是跟消费相关,然后后续几年的话,我们基本上到现在能够拓展到市场一个几乎全行业的覆盖,可能还有一些细分的子行业,可能还没有覆盖到,从其他行业覆盖的结果来看,包括在科技、金融、人员板块,包括一些制造的板块,其实都有相关数据分析,包括我们讲模型训练的结果,从我们自己的切身实际做的感受来讲,实际上每个行业最后做法,其实差异还是蛮大的,其实最大的问题就是周期和消费这两个行业,怎么样用一个数据分析这两个行业中间的逻辑会出现巨大的差别,举一个简单的例子,当然也不是对所有的周期和所有的消费子行业都一模一样,大体上来讲可能会分成比如说两个截然对立的情景,比如说我们做周期这样一个数据来讲,从投资角度来讲,我是希望这个数据越差,从我们自己感受来讲,作为投资来讲反而是比较好的时间点,一般这个数据变得特别特别好,这个数据度量行业基本面景气的情况,当这个数据变得特别特别好的时候,可能对一个周期内的公司或行业来讲,从投资角度来讲,反而不应该买入,甚至是到一个阶段要变成一个卖出的信号。反过来对消费行业来讲,未必就是相反的情况,它更多是不断拿我们观察的数据和市场预期的数据差距去度量的,我们观察到整个的数据它的情况在变好,景气在变好,这个变好如果没有赶上券商分析师整个市场一致预期变化速度,即使变好,也对投资未必是一个能够获得比较好的收益的投资。另外如果是变好但整个市场的预期没有跟得上变好的节奏来讲,这时候对于投资来说又可以变成可投资的节点了,这中间的过程对于每一个行业来讲,从我们自己的原则来讲,我们希望每一个行业单独去建模,单独去做。相当于我希望找到每个行业所适用的模型,所适用的数据跟踪的方法、数据跟踪的维度,最终我们希望做到每一个行业我用一套不同的数据来跟踪,这个数据是驱动这个行业基本面最核心的数据。同时每一个行业基于每个行业不同跟踪的数据,我们能够训练出不同的基于数据投资逻辑。有的刚才讲了,偏所谓逆向的,差的时候买,好的时候卖掉,有的行业可能是偏趋势的,有的行业偏更市场的,以至于此起彼伏的关系,具体落实到行业,包括金融、包括科技,包括能源、制造、公共事业这些板块,每个行业背后的逻辑其实都是不一样的,首先跟踪的数据都不一样,其次基于这些数据做行业层面的判断,判断一个行业投资机会的好坏背后的逻辑也不一样。所以我们现在是最后方法就是把本来投资大问题切分成很小的问题,对于投资组合来讲最后呈现给大家是一个组合的净值、组合的业绩,但我们做这个事情,最后净值、业绩怎么来,实际上我们把它拆成上百个细分的问题,每一个问题单独去解决,我再把拆卸的问题组合起来,变成我们最终一个产品的业绩或者产品的净值。

  4)AI投资机器人专注细分行业

  严佳炜:刚才查博提到会把很多问题拆分成上百个细分问题,我们是否能把这上百个问题的解决方案,理解为你们之前所说的AI投资机器人的概念?

  查晓磊:对,在我们内部来讲,我们拟人化的把它叫做一个小问题就类似于有一个小机器人在帮我们去跟踪,最后形成除了我们十几个人类,我们叫做人类主动管理的研究员来讲的话,剩下我们可能还要大批量几百个模型,或者刚才你讲的机器人,通过他们的跟踪不断的也是基于数据的变化,数据有变化有起伏,也会有不同的信号提示出来,有点儿像几百个机器人相当于我变成一个虚拟化的研究员,除了我们十几个主动管理人的研究员,可能我通过AI的方式训练出几百个虚拟化机器人的小研究员,每一个机器人的小研究员专门盯一个小的细分问题,一个细分的子行业。

  严佳炜:我们团队之前也是做了很多传统量化研究,大家都是基于量化因子去构建多因子模型,每一个因子代表的是市场的一个风格,至少从长期来讲可以赚钱的一个稳定的阿尔法因子,但是您这边相当于把这个因子再拓展到了新的维度,每个投资“机器人”专注于某一个细分的行业。但我很好奇一点,这些AI机器人的构建或者打磨过程中,是纯量化的研发方式,还是会参考一些HI(人脑智能)的经验,比如会结合行业研究员定性的行业逻辑?

  查晓磊:这个答案是肯定的,肯定会的。我们一直讲我们浙商基金是AI+HI,包括我们一开始提的组织架构设置,最直接的目的就是希望我们的AI研究员、AI基金经历跟HI主动管理的研究员、基金经历有比较好的交流,有比较好的互动。我们提出我们现在所有训练出来的模型或者是叫机器人也好的话,其实本身单纯AI单纯量化或者机器人训练角度来讲,其实没有创造出额外投资的智慧,也就是这个α我们是更多通过从人那边学习之后,这时候我们量化模型、量化机器人才具备投资的能力,或者是说对一个他所负责的行业,他才具备一个初步判断它投资价值的能力。所以打一个比方来讲,我们现在有点儿像第一代阿法狗的样子,阿法狗本身是靠计算机科学家写一个深度学习的代码,然后有这样的模型,其实阿法狗也不会下围棋,在这个夸奖之下,只有当模型出来之后,再把人类历史上几万甚至几十万的棋谱输入进去之后,让他学习完了之后,这时候才会下围棋,所以我们回过头来想这中间最关键它为什么会下围棋?在于它学习的这些棋谱,如果没有这些棋谱,只靠深度学习的模型来讲,框架是有,只能证明阿法狗具有具备学习下围棋的能力,但是如果没有棋谱给它学习,它也不会下围棋,所以我们现在有点儿做就是说相当于也是第一代的阿法狗,实际上通过跟HI主动管理的基金经历研究员,包括们券商的分析师、各个行业的分析师到我们公司来,我们在梳理和总结各个行业的棋谱,总结出来之后,在我们AI的训练学习框架下,让我们机器人把这个棋谱学会,学会之后它才具备了投资的能力,所以整体逻辑框架是这样的,虽然我们最终输出信号有很多AI的信号输出,但其实背后都是我们通过学习大量的,其实这里面不光是我们内部的研究员和基金经理,包括我们券商的各个行业的分析师,各个行业里面做的最好的分析师其实都是我们学习的对象,通过不断的学习,其实是把人的投资智慧学完了之后变成我们机器的投资能力。

  严佳炜:刚才听了查博的介绍,我突然想起在机器学习领域有句话叫做“Garbage in, garbage out”,意思就是说,如果你把一些垃圾数据扔给模型,它生产出来也是一些垃圾信息。其实,我能理解,您刚才说的整个决策体系中,数据是基础的,当然更重要的是什么?更重要的是HI(人脑智能)这块,也就是所谓的“棋谱”。只有把有效的“棋谱”教给模型,把有用、有效、经过市场检验的投资经验输入到模型里面去,模型才能越学越聪明,从而能够应对不同的市场环境。

  查晓磊:对,实际上就是说,其实在前面这步还是挺关键的,在梳理棋谱的过程中,实际上您这边也是做量化的,其实里面讲一个性价比的问题,经过我这个棋谱的梳理之后,其实整体是在提升我们整个输入信息的信息海量,我并不是把市场所有信息一股脑全部塞进去,这样对训练模型来讲稳定性、预测性、外推能力是比较差的,当我们把棋谱梳理之后,等于我们是进行逻辑层面的筛选,就像我们原来做量化都可能半开玩笑说,很多模型更多是数据的推演,但如果只是数据推演,我们发现很多模型一旦到了预测,到了外推或者样本外就出现整个能力大幅的下降,我们现在更多是做一个逻辑的推演,逻辑推演相比数据的推演整个外推的能力包括样本外的能力应该来说更加的稳定,或者是更加的靠谱,数据未必能外推,当然逻辑可能有变化,但大的环境或者大的结构没有出现变化情况之下,整个逻辑其实是相比数据更容易去外推的。

  严佳炜:另外,各位投资者可能比较好奇,万一上百个AI机器人,以及HI人工,产生不一致的观点或者信号的时候,例如一个AI看多某行业,但是另外一个AI是看空的;甚至说行业研究员看空行业,但AI信号是看多的。这种情况下你们会怎么判断?

  查晓磊:这比较有意思,首先比如在我模型或者机器人之间出现观点不一致的情况下,我们做法比较简单也比较直接,就是由市场验证优胜劣汰,虽然我们现在目前体系里面大概可能有几百个机器人,但在我们所有过去这么几年时间里面,我们各个细分行业沈指导各个上市公司训练出来的模型达到上千个,实际上在这个过程中,你看现在留下几百个,实际上可能更多的大几百个已经被淘汰掉了,原因就是说一开始比如说训练的时候确实结构比较好,我们也有优胜劣汰的机制,它会逐步被一些就是说能力更强的模型给替代掉,怎么证明它能力强,也没有其他特别好的办法,就是市场的验证,其实做投资来说,有各种各样的特点,其实我们自己感受最深的特点就是投资里面就是它的反馈是很集结的,我们做一件事情,这件事情到底对还是错短期内不一定知道,但投资市场在不短的时间内告诉你做的投资决策是对的还是错的,所以机器人之间我们就通过市场竞争的机制让他优胜劣汰。第二个就是说如果我们模型和人之间发生冲突或者观点不一致,这其实对我们训练或者机器人提升角度来讲是特别特别有用的一个样本,其实我们是希望出现不同结果的,出现不同结果我们一般应对方式就是,这时候就是AI和HI就要坐下来了,我们AI研究员基金经历和行业研究员就要把出现问题的背后逻辑梳理一下归因,寻找原因到底是什么问题、什么原因导致两边观点不一致。其实这种情况在我们内部也经常发生,比如说我们一开始筹建模型的时候,原来这个逻辑主动研究员也是认的,但是过了一段时间市场出现一些结构性变化的时候,可能这个关键的点,因为如果历史上没有明显发生过,训练角度并不一定会及时的扭转这个观点,这时候人的观点加入进来,可以对它进行一个归因然后去分析背后其中的原因,把它之前逻辑出现一些修整或者出现一些调整,如果是碰到他的结构性变化来讲,如果通过分析讨论觉得背后的逻辑已经出现了明显的变化,这时候我们也会停止机器人的工作。也有的情况就是最终也是最后发现我们机器的观点是对的,人的观点也未必对,如果落到这个上面,最终非常大的原则还是市场去检验大家最终的对策,不管最终哪边错了,其实人和机器都可以得到进步。如果最后证明人对了,机器这边可以把我的逻辑重新梳理,提升它的能力,最后证明如果人这次不对,对研究员来讲就会更加的激励他以后考虑一个问题方方面面可能要考虑的更多一点,对研究员来讲也是一个提升的点。

  5)智能投资的未来发展

  严佳炜:查博刚才非常详细地介绍了浙商基金在大数据与人工智能领域的研究,那我们接下来就花几分钟将议题聊地更为宏观一些,我们聊聊智能投资的未来。

  我们知道,国内量化智能投资也是经历了几步走的过程,例如在13、14年及之前,算是量化1.0阶段,期货对冲工具刚普及,购买一揽子股票简单做一个对冲,整体的阿尔法都还是比较显著的。股灾期货受限之后,产生了多元化的发展思路,模型也往更精细的方向拓展,近几年市场涌现各种高频量化,业绩非常出众,规模也是节节攀升,包括部分头部量化私募在模型端会大量采用了人工智能算法,这是量化2.0时代。未来,我觉得人工智能和大数据将会给量化领域进行新层次的赋能,我们可以把大数据、人工智能赋能的量化称为是量化3.0。查博对我定义的“量化3.0时代”有怎样的看法?比如说未来三年或是五年之后,浙商基金的这种AI+HI的投资决策体系,能够在大资管领域有较为广泛的普及?

  查晓磊:好,这个问题确实挺好的,对未来整个我们资产管理行业的变化的我们自己的一个看法。首先AI在投资领域应用,在我们做现在这个事情之前,我们其实做过比较细的拆分,我们其实最后的结论也比较明确,第一个就是AI刚才已经讲了,在高频领域的应用它的优势是特别明显的,就是在一些纯粹数据的驱动的领域,因为我们也知道在高频的领域里面其实更多逻辑不一定是第一的,很多时候是数据层面,但数据层面背后也是对应逻辑的,但未必是先要把这个逻辑先要分析出来再去做后面的模型,顺序不一定先逻辑后数据,可能先数据后逻辑,当我发现一些数据的异相导致一些交易的机会,背后可能是因为一些行为金融的理论、形容金融逻辑导致的。在高频领域里面确实是机器AI优势和擅长,对于公募基金来讲,在交易品类方面不是我们的优势,所以我们更多会从更低频的策略产品角度入手,从中低频角度来讲,我们目前切实的感受就是说,这时候其实人机一定是要交流和互动的,就是AI和HI在中低频这方面,一旦频率降下来,其实一些逻辑的问题就应该要走到数据问题之前了,就不能再是先数据再逻辑的关系了,如果先逻辑后数据就一定要强调人和机的结合,所以这也是对我们浙商基金作为公募基金最后选择的一条路。

  其实在这个框架之下其实它有几个,我们觉得整体方向未来是会朝这个方向去的,最核心的一点就是说,随着整个市场里面专业的管理人,专业投资管理机构越来越多,而且我们投资者的教育的程度也越来越高,大家越来越希望能够买一个理财产品或者买一个基金的投资产品的话,我们每天或者每年的收益大家希望是讲得清楚的收益,就是这个收益来源究竟是来源于哪里,它可不可持续,然后这个背后的方法是不是能够经得住时间,每年或者每一个周期,如果我一直使用同样的方法,我不管最后的结果怎么样,但我使用这个方法之后它是基本上能够比较大的概率能够获得收益或者是超额收益的,所以投资者不管是专业机构投资者还是我们普通的一般持有人,大家对这个要求其实是越来越高的,大家对讲不清楚的一些收益来源的投资策略和产品的话,大家其实随着投资者教育的提升,虽然过往历史业绩比较好,但未必所有投资者都是买单和认的结果。所以我们AI+HI最核心的想法就是说,希望我们所有投资策略都是通过历史上沉淀下来的,被证明行之有效的投资策略,我们不断拿行之有效的投资策略结合市场不同的发展的情景,然后使用这些有效的投资策略。

  当然投资也不是能保证百分之百,至少说如果不断重复使用这些投资策略的话,能够比较大的概率提升我们获得一个比较好的风险回报的结果,这时候对整个产品来讲,收益来源更加说的清楚。另外一点就是大家对整个体系认知之后,有点儿像工程化流水线的作业方式,就是从原材料各种数据的输入,到我们几百个模型的处理训练之后,并且变成最后的结果,它其实是流水线作业的过程,所以在这个过程,其实就是生产风险回报的过程。那对整个产品管理的不管是容量也好,半径来讲,也是一个比较大的提升。就是说相比我们单一基金经理的管理半径来讲,理论上来讲通过系统化的方式,它的管理能力和管理边界比单个人是要大一些的,单个基金经历或多或少对自己以前专门研究的方向或者擅长的行业、擅长的风格大家其实是想把它往极致的方向去做的,但如果通过系统化,其实我们每时每刻都在不断平衡市场里面风险回报的机会,去选择里面我们认为性价比最好的产品。比如消费好的时候,我们这边的模型会有很多的信号出来,当周期来的时候,我们也会及时的切换过去,它是不断比较各个行业性价比的过程。如果是中低频率的话,大家去看首先大逻辑是先有数据,然后就是人机结合我们认为是在目前科技发展水平下,应该是比较现实的选择。

  严佳炜:刚才也聊了挺多,查博也从公司AI战略布局,以及整个投研体系AI+HI框架性的方法论的角度,都给我们进行了非常详细的介绍。

  严佳炜:谢谢查博今天给我们介绍了人工智能和大数据的方方面面、以及浙商基金在科技如何结合投资方面的前瞻探索。那我们今天的直播到此为止,感谢查博,也祝愿浙商基金在未来人工智能以及大数据这条路上能够越走越好。

  查晓磊:感谢感谢。

  严佳炜:也祝这个产品大卖。

  查晓磊:谢谢。

(东方财富研究中心)

更多股票配资知识关注股票配资平台www.ylqaqzz.com

关于作者: 智交易

热门文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注