中国科学软件网-首页
Stata编程技术五一训练营通知

爬虫俱乐部将于201952日至4在武汉举行Stata编程技术五一训练营,此次采用理论与案例相结合的方式,旨在帮助大家熟悉Stata数据分析技巧,能够通过编程读取不同类型的数据源、实现复杂数据合并、清洗的程序化,并且熟悉Stata核心的爬虫技术。

 

爬虫俱乐部已多次举办线下培训活动,曾经在武汉大学、华中科技大学、中央财经大学、中南财经政法大学、华中农业大学、郑州大学、河南大学、福州大学、长沙理工大学、湖北大学和湖北经济学院等进行师资和研究生实证方法的培训,获得了一致的好评。爬虫俱乐部的公开培训也进行了十多场,场场爆满座无虚席

 

我们会继续努力,以培养学生、技术研发为己任,在少量盈利的基础上,努力将公益事业做好,传播实证技术和数据分析方法、开发数据分析的工具等,造福于学术界!

 

主讲老师

李春涛,香港大学博士,中南财经政法大学金融学院教授、博士生导师;主要研究领域是公司治理和企业创新,在《经济研究》、《金融研究》、Journal of Comparative Economics等主流期刊上发表学术论文三十余篇。李老师是Stata统计软件的资深用户,有20多年的Stata编程经验,他有十多名学生正在或曾经在海外名校从事研究助理工作。

 

薛原,曾任香港大学经济金融学院研究助理,现为华中科技大学管理学院博士生,爬虫俱乐部资深成员,擅长StataPython编程及网络爬虫技术。与李老师合作开发了cnarchinagcodechinaaddresscnintradaycnstocksubinfilereg2docxsum2docxwordconvert等重要命令,实现了中国上市公司数据的命令化模块下载、中文地址与经纬度之间的转换,实证结果的格式化集成输出等,曾在金融学国内顶级期刊发表过论文一篇。

 

闫续文,爬虫俱乐部资深会员,长期讲授结果输出方法,现为香港岭南大学海外研究项目研究助理。

 

培训目的

本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Stata的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使你能在短时间内掌握Stata的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。

 

培训对象

国内高校教师、硕士生、博士生、即将开始科学研究的准研究生、科研院所科研人员、社会团体及Stata爱好者。

 

课程大纲

第一部分:基础篇

Stata的界面与DOS命令

获取帮助的技巧(在线帮助、搜索帮助、人肉帮助)

各种数据的读入(Excel、制表符、固定宽度等)

不规则数据的整理、数据搬家与填充(基金经理变更案例)

copy命令(文件转移、文件重命名、网络文件读取、网页源代码读取)

日期定义和日期函数

函数与基于扩展函数的generate

 

第二部分:宏与循环

local概念与基本操作(如何定义local

global概念与基本操作(与local的区别)

宏扩展函数(将dis结果、dir结果等赋值给local

循环(while, forvalue and foreach

跳出循环的continue continue, break

上交所年报抓取案例(forvalue循环,日期函数、容错命令cap、循环过程中的终止)

foreach循环, 读入多个csv文件

大量数据文件的读取

Excel多个Sheet数据的读取对变量取值的循环

 

第三部分:数据库的操作

数据的纵向合并(CSMAR交易数据为例、cntrade命令)

数据的横向合并(财务数据为例)

数据长宽变换 (wind财务数据、多列变一列reshapestack命令)

起死回生(preserve restore命令)

label(文件label、变量label、观测值label)

label找变量(labelsoflabel的宏扩展函数)

字符串处理(长度、关键词、替换、提取、寻找总经理、寻找董事长、两职合一)

 

第四部分:post命令

post原理

定义post

post计算同步性和Beta

基于云端数据的事件研究

股本变更数据整理

 

第五部分:结果输出

输出表格或图形到WORD文档、EXCEL文档和PDF文档:putdocxputpdfputexce

基本统计信息:sum2doxc

分组检验:t2docx

相关系数矩阵:corr2docx

简单线性回归:reg2docx

 

第六部分:网络数据

上市公司公告的抓取

上市公司高管任职信息抓取

深交所信息披露考评数据抓取

上市公司媒体关注(百度新闻相关结果数量)抓取

港股交易数据抓取

 

注:

请学员自带笔记本电脑,我们将提供Stata原厂软件试用程序。

本次培训食宿及往返交通费用学员自理。

即日起开始正式报名和收费。

 

相关单位

主办方:武汉字符串数据科技有限公司、爬虫俱乐部

 

培训时间地点

时间:201952-54

地点:湖北-武汉

 

在线报名:

http://www.sciencesoftware.com.cn/NewTraining_detail.aspx?trid=288


软件培训(软件列表900x450)2.jpg微信二维码(900x300)-订阅号2.jpg