【干货】基金数据分析看分析的几个维度分析!
【干货】基金数据分析看分析的几个维度分析!
前言
大家好,你们有理财产品吗?这不是推销,只是分享一篇关于基金数据分析的文章。为了照顾对基金一窍不通的童鞋们,文章前面特地做了一个小科普,帮助大家了解指数基金和股票基金的概念。
然后我用Python爬取了这些基金收益的数据,从6个维度全方位分析,最后得出相应的理财建议。当然,投资有风险,入市需谨慎。本文的重点仅是数据分析。对了,大家不要太迷信结论了~
文本
本文为系列文章第四篇,分析2021年第三季度基金仓位披露数据
文章篇幅较长,阅读需要5-10分钟。阅读本文后,您可能会获得以下几点:
1.文字
好的,和往常一样,这篇文章分为三个部分:
鉴于本文的整体基调是对基金的分析,因此有必要简单介绍一下什么是基金。
当然,它只停留在一个简单的介绍上。本文多爬取近年发行的基金收益、持仓等数据,并做一个简单的分析
目前各基金公司披露的持仓数据截至2021年第三季度,未来将披露最新的持仓数据。小艺会继续跟踪分析,到时候记得回来查看更新!
ok,直接开始,去
1.1 基金介绍 只想看分析的同学可以直接滑到第三小节
只想看结论的同学可以直接滑到文末
首先,什么是基金?
首先,对于基金来说,大致可以分为:货币基金、债券基金、混合基金、股票基金等。
主要说说这几个是什么,然后我们就用数据来分析一下。
货币基金
只投资于货币市场,如银行存款、国家或公司发行的短期债券等,可以等同于储蓄产品,因为波动性较小,风险较低。
类似余额宝是货币基金,对这种货币基金的评价主要看:7天年化收益率和10000股收益。
这个比较容易理解,风险也很低。个人如果选择币种基金,直接去余额宝完成业务,T+0,简单简单。
债券基金
与货币基金相比,债券基金投资的债券期限较长。除了债券,他们还可以投资股票。
债券基金相对于货币基金有一定的风险,但长期来看,收益也会更高。
混合基金
与债券型基金相比,混合型基金除了债券之外,还可以投资不同风格的股票。
混合型基金根据股票和债券的比例进一步细分为部分股票型基金和配置型基金。
与前两者相比,混合型基金可以实现投资的多元化,无需购买不同风格的股票基金、债券基金和货币基金。
股票基金
股票型基金是指投资于股票市场的基金,其股票头寸不得低于80%。
股票型基金可以细分为主动型和被动型(指数基金)等。与主动型基金相比,指数型基金会更加稳定,并紧跟大盘指数的波动。
与前三者相比,股票型基金属于高风险高收益基金。
再来看看今天的核心:爬虫+分析
2、基金数据抓取
爬虫部分的核心代码比较简单,比上次的出租数据爬取简单x倍。今天主要讲一下过程。
想学爬虫的同学回头看租房数据:实践中的爬虫——获取最全的租房数据 | 天天要闻 附上源代码
对于基金数据的爬取,小易选择了天天基金网。主页如下所示:
可以看出,基金的种类:股票、混合型、债券型和指数型是分明的。收集字段时,请记下每个基金的所有收益。
ok,那就直接用官网设置的标签爬取,采集上图圈出的数据字段。
第二步是各个基金的详细仓位,见图:
主要包括基金成立时间、规模、基金管理人、各季度的详细职位。
爬虫的总体思路是爬取每个基金标签下的所有基金以及收益率。根据基金代码,爬取各基金,获取详细指标。根据基金代码,爬取各基金的季度仓位。
需要注意的是,第2步和第3步的数据不在同一个页面下,第2步的数据可以通过页面解析得到,第3步的数据动态加载并呈现在页面上,可以得到通过接口数据。
限于篇幅,主要代码如下:
# 爬取每个基金的数据rank_detail_data = []position_data = []error_funds_list = []for row_index, data_row in data_rank.iterrows(): fund_code = str(data_row['基金代码']) try: '''爬取页面,获得该基金的详细数据''' position_title_url = "http://fundf10.eastmoney.com/ccmx_" + str(fund_code[1:]) + ".html" print('正在爬取第 {0}/{1} 个基金 {2} 的详细数据中...'.format(row_index+1, len(data_rank), fund_code[1:])) response_title = requests.get(url=position_title_url, headers={'User-Agent': get_ua()}, timeout=10) # 解析基金的详细数据 rank_detail_info = resolve_rank_detail_info(fund_code[1:], response_title) """爬取页面,获取该基金的持仓数据""" position_data_url = "http://fundf10.eastmoney.com/FundArchivesDatas.aspx?type=jjcc&code=" + \ str(fund_code[1:]) + "&topline=10&year=&month=&rt=" + str(random.uniform(0, 1)) print('正在爬取第 {0}/{1} 个基金 {2} 的持仓情况中...'.format(row_index + 1, len(data_rank), fund_code[1:])) # 解析基金的持仓情况 response_data = requests.get(url=position_data_url, headers={'User-Agent': get_ua()}, timeout=10) fund_positions_data = resolve_position_info(fund_code[1:], response_data.text) # 保存数据 rank_detail_data.append(rank_detail_info) position_data.extend(fund_position_data for fund_position_data in fund_positions_data) except: error_funds_list.append(fund_code) print("{0} 数据爬取失败,稍后会进行重试,请注意!".format(str(fund_code[1:]))) # 随机休眠2-4 秒 time.sleep(random.randint(2, 4))
爬取完成后,数据如下:
3、基金数据分析
对于4类基金数据,以下主要分析股票型基金
首先,共有1417只股票基金。后续分析排序的依据是今年的产量指标。请注意以下事项
1.基本:产量分布
1,417只股票基金中有1,410只今年未出现空头收益。分析它们:
今年收益率>0的股票型基金840只,占比59.57%;今年整体平均收益率为5.89%
如下所示:
我们来看看回报的整体分布:
股票型基金收益率小于0,占比40%,随着收益率的提高,基金数量逐渐减少,与上一季度正态分布的形象形成鲜明对比。
此外,收益率超过50%的基金只有13只,实属罕见
2.基础:资产规模分布
至于资产规模,小义是这样理解的:资产大的基金,在收益稳定的情况下,周转难。
由于基金数量较多,以下仅选取今年收益前300的基金对其资产规模进行分析。此外,资产规模为截至2021-09-30的资本资产规模。
一起看图:
股票型基金资产规模集中在0-10亿元区间,其中10只基金规模大于70亿元,占比3.33%
可以看到,在20亿元以下规模的基金中,80%以上是基金,与上一季度的78%相比增长了2PP。
3. 焦点:前10名的收益!
看完基本面,下面是一些干货:
股票型基金今年最高回报113.98%,Top10平均回报62.98%
可以看出,收益率前10名的基金差距比较明显,尤其是基金“前海开元公用股”收益率最好,拉升第二名51.2个百分点,是大牛中的大牛。
除了第一名,其他2-10的基金收益都比较稳定,尤其是2-5之间,差距很小。
从图中可以看出,资产规模与近两年的收益相关性并不强。此外,前5名的基金似乎是一个不错的选择。
以供参考:
4、干货:基金经理该选谁?
买基金要看基金经理,所以这一步就是分析基金经理
同理,我们选取??收益率最高的前50名基金进行分析,根据基金经理持有的基金平均收益率选取前15名的基金经理,如下图所示:
平均收益排名前 5 的股票型基金经理各持有一只股票型基金,我们在上一步中已经看到了对应的股票型基金。
可以看出,这一次的结果与上一季度的分析结果完全不同,尤其是顶级基金经理,基本都在洗牌
当然,部分原因是我把时间粒度从近2年缩小到了今年。
在股票型基金经理中,崔辰龙持有的基金涨幅巨大,今年的行情还能保持翻倍的收益,着实令人印象深刻。
此外,经理崔晨龙还管理着一只混合型基金“前海开元新经济混合型A”,今年的收益率为110.01%,位居今年涨幅榜第二位。好奇的可以看看这两只基金的最新仓位,应该就能明白为什么会有这么高的回报
概括:
两极分化比较严重,尤其是今年这种特殊的行情,把握主线应该可以赚大钱,不然可能白干了一整年
5、干货:重仓应该买哪一件?
先说一个大家比较感兴趣的内容:基金持股
各基金持股前10名可作为基金代表。这一点毋庸置疑,所以在爬虫部分,我们也直接爬取了前十的持仓数据。
在本节中,我们还选取了收益率最高的前 50 名股票基金和混合基金进行分析。
每只基金都有前10名的持股,因此对应的持股有500只,选取累计持股比例前30名的持股作为重点观察对象,如图:
需要说明的是:粗体表示在股票型基金和混合型基金中均有出现。
可以看出,持股前15名的股票基本以光伏产业链和新能源为主,包括:以宁德时代为首的光伏产业链、以比亚迪为首的新能源产业链
不过需要注意的是,15-30的持股差距还是很大的。从不同个股的分布来看,对应板块集中在能源、有色金属、钢铁和石油等。
有兴趣的可以翻到文章开头看看第一季文章这个位置的图片是什么样子的,然后再看现在的图片做个对比
想必即使不了解板块和个股,还是能看出一些端倪的。
概括:
这是今年收益率排名前50的基金的位置。显然,光伏+新能源是主线,持之以恒。
上图中看不到对应的酒和药。
但是,但是支付宝基金数据爬取,有很大的分歧,请继续阅读!
6.重磅干货:跟明星经理一起买?
最后我们继续抄作业,抄优等生的优秀作业
选择5个股票明星基金经理及其持有的5只基金,如下图:
选取这5只股票基金的前10持股再次分析:
这里的分析思路和第6节一样
如果您在第 6 节中看不到上图中的不同之处,那么您现在必须能够清楚地看到这张图。
同样,股票型基金和混合型基金也一直持有与光伏产业链相关的股票,但一致性比例已经降到了16.7%,而当时一季度的一致性为40%
当然,这也和今年的行情有关,尤其是下半年之后,板块频繁轮换,很难有一个总能冲上去打前锋的板块
因此,也会造成基金经理职位的分散。既然都是轮换的,我就选一些低位的,既可以避免高位板块的回调,又可以在轮换的时候乘风破浪。
精彩的!
概括:
分歧是好的,意味着下次有新的更好的机会
当然,现在机会可能并不明显,从以上的仓位来看,也无法看出明星基金经理调整仓位到了哪个板块。
不过,机会总会有的,等着吧。当第四季度的位置被披露时,答案应该会揭晓。
尤其是近期白酒板块的变化支付宝基金数据爬取,以及基金经理调整医药等仓位的八卦,都是分歧的开始
我们也在等待春风!