思考了一会儿,周昀连上服务器,新建了一个文件夹。
本来他还以为上一个课题结束之后,服务器账号就会被收回,他还特地问过这件事情,毕竟八卡的H100就算是租也需要一笔不小的费用。
哪知道邓永华大手一挥,让他先用着,等组里买好服务器了再说。
那周昀总不能拒绝吧?
既然老师说了继续用,那就继续用呗。
技术方面的事情周昀心里有数,他刚刚就想到了几种还不错的方案,只不过具体有没有效果还要实验了才知道。
想要实验,最重要的还是数据,而想要数据,他就需要尽快定下来,想要预测的股票,才能去网上爬数据。
“该选什么股票呢?”周昀双手放在键盘上,迟迟没有动手。
股票的事情他其实不太熟悉,主要是他从来没有去深入了解过,所以在他眼里股市=赌场,这种概率性太大的事情他一向不太喜欢去做。
“周昀,想啥呢?你也要买股票?”一旁的邱彦听到周昀好像说了“股票”两个字,这才问了一嘴。
“嗯,不是我要买,我是想着,现在不是有很多量化公司吗?但是这东西说白了就是深度学习模型,
我想着能不能选一只股票用模型来预测一下,如果成了说不定还能赚点钱。”
邱彦顿时眼睛一亮:“这个想法好啊!如果真的能成,到时候不说大赚,至少不会亏的这么惨了。”
“是啊!不过这要实现起来应该挺难的吧?”沈瑞觉得这事情没这么容易。
周昀点点头:“技术方面我有了一些想法,只是需要时间验证,现在的问题是,我不知道该选什么股票。”
“这确实得好好想一下,我有一点想法,可以作为参考。”俞天睿手指轻敲桌面缓缓开口,要说实验室里谁对股市最为了解,那绝对是他了。
一万的本金,他花了一年的时间让其翻到了三万多,这在普通人里已经算是非常NB了,毕竟这是年化300%的收益率。
“师兄你说。”对于不了解的领域,周昀向来是虚心学习。
“其实我并不建议你选择个股,因为很大程度上来说,
个股的走势受多重复杂因素影响,比如财报暴雷、高管变动、产品事故、股东减持这些不可预测事件,
更别说有些盘子小的股票可能会存在被资本大手操控的情况,所以相比个股,我更建议选择ETF,
因为ETF的走势更多由系统性因素驱动,简单来说受个人的影响很小(当然也有例外),这样的情况下,各种技术指标的可靠性就会更高,也更加容易预测,
比如有些厉害的人都能预测其大致的走向,我觉得深度学习模型应该会做的比人更好,
而且ETF的波动一般都不大,极难出现一天十个点的情况,所以就算日后真的亏钱了,也能把亏损控制在一个合理的范围内,
我比较推荐两支ETF,都是我自己重仓的,一个是黄金,一个就是恒科,这两个ETF都支持T+0交易,也就是当日买,当日卖。
不过具体怎么选,还需要师弟自己调研一下,我的话也不一定对,只能做个参考。”
周昀一边听着一边顺手记了一下:“谢谢师兄,我再自己了解一下。”
“没事,这些东西就算不告诉你,也很容易了解,算不了什么。”
虽然听师兄说了个大概,不过周昀还是自己查了点资料。
接下来的一周,他都在研究股市,不过身上没什么钱,只能拿模拟盘操作一下了。
战绩也是非常辉煌。
-18%
亏了十八个点,毫不意外的血亏,其中17%都是在个股上亏得,明明每一次买进的时候他都觉得不会再跌了,结果第二天还是照跌不误。
经过调研加上亲身实践,他最终决定了,就选黄金ETF!
主要是他记得,未来黄金似乎都在一直上涨,就算预测的不准,应该也不会亏钱。
而实验室的师兄师姐知道了周昀又有新的idea之后,毫不犹豫地想要加入,周昀自然是来者不拒。
虽然核心的模型架构设计和算法上师兄师姐们帮不上什么忙,但是收集数据,清洗数据,数据标注,对他们来说还是小菜一碟。
这种工作一般都是研零或者研一才会干的事情,毕竟处理数据这种事情就两个——麻烦。
现在倒是有点倒反天罡的意思了,不过几位师兄师姐却没抱怨什么。
自己什么水平,各自都清楚,周昀这种刚来就能发NeurIPS的,在他们眼里已经是妥妥的大佬了,帮大佬打杂,
顺便混一篇A会打底的二作三作,傻子才不干,虽然对找工作没什么用,但是对评奖学金有用啊。
至于给年龄,都什么年代了,懂不懂什么叫达者为师啊!
邓永华也通过组会知道了这个事情,他也没反对,只是提醒大家先做好自己本职的科研工作,否则自己毕业都成问题的话,混个二作三作也是啥用没有。
时间很快来到了七月份。
实验室里,师兄师姐都围在周昀身后,所有人的眼睛都死死盯着屏幕。
屏幕上一共有两个界面,一个比较简陋,只有一根折线图,另一个则是交易平台的软件,上面显示的是黄金ETF的实时走势。
粗略地看上去,两根折线似乎是一模一样的,但是如果仔细观察就能发现,很多细节上,两者的走势完全不同。
这就是周昀他们近两个多月的研究成果,一种全新架构的时间序列预测模型。
“还是有点问题,不过暂时也只能做到这种程度了。”周昀看着两个界面叹了口气。
“我觉得已经很好了,不超过0.1%的误差,还不够吗?”
“是啊,其它的模型我们不是也跑过了吗?误差基本都在1%以上。”
虽然话是这么说,但是周昀还是觉得这个模型其实是有很大优化空间的,不能提升的原因还是一个——资源不够了。
哪怕是八卡的H100,也是有上限的,而如果想要更进一步的预测走势,就需要更多的数据,这里的数据就不仅仅是历史的价格了,
更是包括了和黄金相关的各种新闻,信息,这些消息来自世界各地,形式也多种多样,有视频、文字、音频、图片。
这就涉及到了另一个领域——多模态大模型。
而一旦涉及到了大模型这三个字,八张H100是远远不够的,因为他要的是训练,而不是推理。