- UID
- 2
- 积分
- 2892307
- 威望
- 1396185 布
- 龙e币
- 1496122 刀
- 在线时间
- 13313 小时
- 注册时间
- 2009-12-3
- 最后登录
- 2024-12-25
|
量化交易之路——系统选型和基础准备
系统选型
1,行情数据获取接口走目前流行的CTP。
2,交易接口走CTP。
3,开发语言主要采用C++/Python,用C++是为了保证效率,特别是数据在不断增加的情况下,效率会成为非常大的瓶颈,用Python是为了快速建立原型和最大化的提高开发效率,减少代码行数。
4,操作系统选型,目前个人业余时间开发主要还是先在win7系统上做开发和交易,后期成熟后会逐步迁移到linux环境以提高系统的整体运行效率,所以开发中使用的开源的库和架构一定要是跨windows和linux操作系统平台,一次编写代码将来简单的就可以移植到linux下运行。
开源库和架构
数据通讯:采用开源RPC框架。之前调研和项目中用过Thrift和RCF,RCF不需要写IDL文件,直接用类继承方式调用,使用上极其方便,但是C++服务器和Python客户端交互要用RCFProto(an RPC implementation for Google Protocol Buffers),需要写Protocol Buffers的IDL文件,这样有点麻烦了。Thrift也需要写IDL但是包含了RPC的一套框架代码,又可以C++,Python语言写的服务器客户交互。考虑到系统需要C++和Python之间的数据通信和尽量高的开发效率还是选择Thrift。
存储:目前白天IF股指期货是最活跃的品种,一天有32406条左右的Tick记录,白天加夜盘AG白银是最活跃的品种,一天有56789条左右的Tick记录,采用分表存储,以全天Tick数据量最大的AG为例,平均一年250天交易日,存储10年主力Tick数据需要存储,250*56789*10=141972500约等于1.4亿条数据的规模,也就是单表要存1.4亿条记录,又能保证开发简单,随机遍历读写性能比较高的存储系统,一般的sqlite,mysql等开源数据库系统不易做到,只能选择bdb,redis,mangodb,tc,leveldb等等kv系统,考虑到每日写入几十万条记录,频繁大量的遍历读取例如选取最近三个月的Tick数据做回测,少量的Seek读取,目前个人开发单机版,考虑性能和资源上的权衡最终选择leveldb,leveldb有winport的版本,后续可以导出移植到linux下的leveldb或分布式的nosql等系统。
压缩:采用snappy,msgpack,rar,zip等。
界面:windows C++使用Qt或MFC,Python用PyQt,界面只求简单易用,不求必须的跨平台,除了手工半自动抄单必须需要界面外,模型自动交易是可以不需要界面的,这样系统运行效率会更高。 |
论坛官方微信、群(期货热点、量化探讨、开户与绑定实盘)
|