龙听期货论坛's Archiver

C
+
+


 微信: QQ:

龙听 发表于 2018-1-29 14:20

量化交易之路——系统选型和基础准备

系统选型

1,行情数据获取接口走目前流行的CTP。
2,交易接口走CTP。
3,开发语言主要采用C++/Python,用C++是为了保证效率,特别是数据在不断增加的情况下,效率会成为非常大的瓶颈,用Python是为了快速建立原型和最大化的提高开发效率,减少代码行数。
4,操作系统选型,目前个人业余时间开发主要还是先在win7系统上做开发和交易,后期成熟后会逐步迁移到linux环境以提高系统的整体运行效率,所以开发中使用的开源的库和架构一定要是跨windows和linux操作系统平台,一次编写代码将来简单的就可以移植到linux下运行。

开源库和架构
数据通讯:采用开源RPC框架。之前调研和项目中用过Thrift和RCF,RCF不需要写IDL文件,直接用类继承方式调用,使用上极其方便,但是C++服务器和Python客户端交互要用RCFProto(an RPC implementation for Google Protocol Buffers),需要写Protocol Buffers的IDL文件,这样有点麻烦了。Thrift也需要写IDL但是包含了RPC的一套框架代码,又可以C++,Python语言写的服务器客户交互。考虑到系统需要C++和Python之间的数据通信和尽量高的开发效率还是选择Thrift。
存储:目前白天IF股指期货是最活跃的品种,一天有32406条左右的Tick记录,白天加夜盘AG白银是最活跃的品种,一天有56789条左右的Tick记录,采用分表存储,以全天Tick数据量最大的AG为例,平均一年250天交易日,存储10年主力Tick数据需要存储,250*56789*10=141972500约等于1.4亿条数据的规模,也就是单表要存1.4亿条记录,又能保证开发简单,随机遍历读写性能比较高的存储系统,一般的sqlite,mysql等开源数据库系统不易做到,只能选择bdb,redis,mangodb,tc,leveldb等等kv系统,考虑到每日写入几十万条记录,频繁大量的遍历读取例如选取最近三个月的Tick数据做回测,少量的Seek读取,目前个人开发单机版,考虑性能和资源上的权衡最终选择leveldb,leveldb有winport的版本,后续可以导出移植到linux下的leveldb或分布式的nosql等系统。
压缩:采用snappy,msgpack,rar,zip等。
界面:windows C++使用Qt或MFC,Python用PyQt,界面只求简单易用,不求必须的跨平台,除了手工半自动抄单必须需要界面外,模型自动交易是可以不需要界面的,这样系统运行效率会更高。

页: [1]