滚雪球 -- 收集沪深港通北上资金信息
项目自动收集沪深港通持股数,聚合实时价格数据以获得持有市值排名。 [docker;tornado;redis;beautifulsoup4]
自从沪深港通开通后,海外机构资金源源不断买入他们眼中最稀缺、最有价值的A股,并长期持有。
港交所从2017年3月17日起,每天公布沪深港通持股数量:
- http://www.hkexnews.hk/sdw/search/mutualmarket.aspx?t=sh
- http://www.hkexnews.hk/sdw/search/mutualmarket.aspx?t=sz
项目自动收集沪深港通持股数,聚合实时价格数据以获得持有市值排名。
可以买入排名靠前的几只股票,长期持有,近两年收益较高。
以docker方式进行部署,共三部分:
- collector 爬取沪深港通持股数并用雪球API获取对应价格,以linux crontab 为基础,用beautifulsoup4解析港交所web数据
- redis 作为数据存储载体
- web 使用tornado框架作为数据展示应用
WEB截图
Demo
安装
$:~/workdir# git clone https://github.com/uname-yang/collect-hkc-hold-position.git
$:~/workdir# cd collect-hkc-hold-position
$:~/workdir/collect-hkc-hold-position# docker-compose up -d
Creating collecthkcholdposition_redis_1 ...
Creating collecthkcholdposition_redis_1 ... done
Creating collecthkcholdposition_web_1 ...
Creating collecthkcholdposition_collect_1 ...
Creating collecthkcholdposition_web_1
Creating collecthkcholdposition_web_1 ... done
$:~/workdir/collect-hkc-hold-position# docker-compose ps
Name Command State Ports
---------------------------------------------------------------------------------------------------
collecthkcholdposition_collect_1 /bin/sh -c cron && tail -f ... Up
collecthkcholdposition_redis_1 docker-entrypoint.sh redis ... Up 6379/tcp
collecthkcholdposition_web_1 /bin/sh -c python3 app.py Up 0.0.0.0:20191->5000/tcp
结语
获取沪深港通持股数据的部分已单独发布成python包pyhkconnect,可返回pandas dataframe格式数据。
此项目代码已上传Github:https://github.com/uname-yang/collect-hkc-hold-position