数据浏览器使用教程

数据浏览器包含清洗过的财务数据、BARRA 因子等高质量数据。

本教程以 BARRA 因子为例,介绍从下载到使用的流程。

纵览

刷新数据浏览器 当开通数据浏览器权限后,可在行情-数据页面,刷新数据浏览器列表,找到对应你需要的高级数据。

代码下载

示例

from xtquant import xtdata

# 第一步:下载数据浏览器全部表信息(metatable)
xtdata.download_metatable_data()
# 第二步:获取表名
metainfo = xtdata.get_metatable_list()
print(metainfo)

参数说明

无参数

返回结果

表对应的中文名,与界面对应

{'cne1d_100_asset_data': '残差风险表', 'cne1d_100_asset_dlyspecret': '资产残差收益表', 'cne1d_100_asset_exposure_wide': '资产对每个因子的暴露度(宽表)', 'cne1d_100_covariance': '因子协方差矩阵', 'cne1d_100_dlyfacret_wide': '因子日度收益', 'cne1_daily_asset_price': '每日资产收益、收盘价和流通市值', 'cne1_rates': '汇率和无风险收益率'}

下载

界面下载

下载相关数据 鼠标移动到对应的数据,可以触发下载按钮,点击进入下载页面,整体下载数据

代码下载

你也可以使用如下 Python 代码,将指定的高级数据下载到本地。

# 第二步:下载 
k = 'cne1d_100_asset_exposure_wide' # cne1d_100_asset_exposure_wide
# 参数说明对照优化如下
xtdata.download_tabular_data(
    stock_list=['XXXXXX.XX'],     # 股票代码列表
    period=k,                   # 表名(如BARRA因子表)
    start_time='20151001',       # 起始日期(YYYYMMDD)
    end_time='20300101',         # 截止日期(YYYYMMDD)
    incrementally=None,          # 是否增量下载,默认None
    download_type='validatebypage'   # 下载类型,通常为'validatebypage'
)

参数说明

参数类型说明
stock_listlist证券代码列表,固定为['XXXXXX.XX'],无需修改
periodstr数据表名称(如BARRA因子表)
start_timestr开始日期,格式YYYYMMDD
end_timestr结束日期,格式YYYYMMDD
incrementallybool/None是否增量下载
download_typestr下载类型,包含'bypage',按条数下载。'byregion'按时间范围下载。'validationbypage'数据校验按条数下载(注意参数拼写)
sourcestr指定下载地址

返回结构

下载无返回

使用

界面使用

鼠标移动到对应数据,可以触发应用按钮,点击应用,数据以因子指标形式展示到对应品种主图下方。

在指标上点击右键-编辑指标,可以进入因子公式编辑页面, 查看因子公式写法。

代码调用

你也可以使用如下 Python 代码,调用指定的数据:

示例

from xtquant import xtdata
k = 'cne1d_100_asset_exposure_wide' # 
df = xtdata.get_tabular_data([k], ['XXXXXX.XX'], period='', start_time='20251201', end_time='', count=-1)

print(df.head())
print(df.columns)

参数说明

参数类型说明
field_listlist数据表名列表,从get_metatable_list 获取,如 cne1d_100_asset_exposure_wide
stock_listlist数据库列表,固定为['XXXXXX.XX']
periodstr时间区间类型,默认为空字符串''
start_timestr起始日期,格式为'YYYYMMDD'
end_timestr结束日期,格式为'YYYYMMDD',可留空
countint返回记录数量,-1 表示返回全部数据
dividend_typestr除权类型,默认'none',除非有特殊需求无需修改
fill_databool是否补齐空缺数据,默认为True,通常无需修改

返回结构

DataFrame 宽表结构,这里建议执行下一步宽表转换为长表,对应数据字典查看。

   cne1d_100_asset_exposure_wide.trade_date  ...  cne1d_100_asset_exposure_wide.instrument_id
0                                  20251201  ...                                    000001.SZ
1                                  20251201  ...                                    000002.SZ
2                                  20251201  ...                                    000004.SZ
3                                  20251201  ...                                    000006.SZ
4                                  20251201  ...                                    000007.

表名和对应关系处理

宽表转换为长表

代码示例如下:

# 1. 预处理:去掉不需要转换的非因子列(如果有 id, seq, timetag 等无关列,建议先剔除)
# 根据你提供的列表,这些列似乎不是因子,不需要 melt 进去:
ignore_cols = [
    'cne1d_100_asset_exposure_wide.id', 
    'cne1d_100_asset_exposure_wide.seq', 
    'cne1d_100_asset_exposure_wide.timetag'
]
# 如果 df 里有这些列,先 drop 掉,防止它们被当成因子
df_clean = df.drop(columns=[c for c in ignore_cols if c in df.columns])

# 2. 重命名“锚点列”(即保持不变的主键列)
# 将宽表里的 id 和 date 映射回长表要求的名字
df_clean = df_clean.rename(columns={
    'cne1d_100_asset_exposure_wide.instrument_id': 'sid',
    'cne1d_100_asset_exposure_wide.trade_date': 'DataDate'
})

# 3. 使用 melt 进行“逆透视”
# id_vars: 不需要动的列(主键)
# var_name: 原来的列名变成新的一列,这一列叫什么? -> 叫 'Factor'
# value_name: 原来的单元格数值变成新的一列,这一列叫什么? -> 叫 'Exposure'
df_long = df_clean.melt(
    id_vars=['sid', 'DataDate'], 
    var_name='Factor', 
    value_name='Exposure'
)

# 4. 清洗 Factor 列的内容
# 此时 Factor 列里还是 "cne1d_100_asset_exposure_wide.size" 这种长名字
# 我们需要把前缀去掉,只保留 "size", "beta" 等
prefix = 'cne1d_100_asset_exposure_wide.'
df_long['Factor'] = df_long['Factor'].str.replace(prefix, '', regex=False)

# 5. (可选) 大写转换
# 图片里的因子名是 'MARKET', 'SIZE' (全大写),而宽表列名通常是小写
df_long['Factor'] = df_long['Factor'].str.upper()

# 6. 调整列顺序以完全匹配图片
df_final = df_long[['sid', 'Factor', 'Exposure', 'DataDate']]

# 查看结果
print(df_final.head())

返回结构

DataFrame 长表结构

--- 2. 最终长表 (df_final) ---
          sid   Factor  Exposure  DataDate
0   000001.SZ     BANK      1.00  20231229
1   000001.SZ     BETA      1.20  20231229
2   000001.SZ  FOODBEV      0.00  20231229
3   000001.SZ   MARKET      1.00  20231229
4   000001.SZ     SIZE     -0.56  20231229
5   000002.SZ     BANK      0.00  20231229
6   000002.SZ     BETA      0.90  20231229
...

对应字典查询

(4) CNE1D_100_Asset_Exposure

字段格式释义样例
sidvarchar股票代码000001.SZ
Factorvarchar因子MARKET
Exposureint股票对因子暴露度1
DataDateint日期20231229

完整数据字典

CNEXTRD 模型解读

模型数据名称描述数据名称 (英文)
CNEXTRD因子协方差矩阵各风险因子之间协方差关系的矩阵,对角线元素为单个因子的方差,非对角线元素为因子间的协方差。用于衡量因子波动的相关性,是计算前瞻性风险和优化投资组合的核心数据。Covariance
无风险收益率无风险收益率为 SHIBOR(3 个月)的年化收益率Rates
因子日度收益各风险因子在交易日内的收益率,计算方式为股票收益率对各个因子暴露度回归得到。该表为全量历史表。DlyFacRet
每日股票收益、收盘价和流通市值个股总收益率,未复权的收盘价,个股总收益用于计算横截面的回归过程。Daily_Asset_Price
个股残差风险因子模型中无法被系统性因子解释的部分风险,又称非系统性风险或特有风险,用回归残差的标准差衡量。Asset_Data
个股对每个因子的暴露度全部 A 股(含北交所)的市场、行业、风格因子暴露度。风格因子暴露度为偏离全市场平均水平的标准差,行业因子暴露度为虚拟变量,所有股票在市场因子上暴露度为 1。Asset_Exposure

提供的表格列表如下:

数据文件列表汇总

文件名释义
CNE1D_100_Asset_DlySpecRet资产残差收益
CNE1_Daily_Asset_Price每日资产收益、收盘价和流通市值
CNE1_Rates汇率和无风险收益率
CNE1D_100_Asset_Exposure资产对每个因子的暴露度
CNE1D_100_DlyFacRet因子日度收益
CNE1D_100_Covariance因子协方差矩阵
CNE1D_100_Asset_Data残差风险
CNE1D_100_ETF_ExposureETF 组合对每个因子的暴露度
CNE1D_100_Factors因子中英文名称映射表

(1) CNE1D_100_Asset_DlySpecRet

字段格式释义样例
sidvarchar股票代码000001.SZ
SpecificReturnnumeric残差收益-0.431576664
DataDateint日期20231229

(2) CNE1D_Daily_Asset_Price

字段格式释义样例
sidvarchar股票代码603088.SH
Pricenumeric收盘价8.62
Captnumeric流通市值373516.9576
PriceSourcevarchar数据源CSC
Currencyvarchar币种CNY
DlyReturn%numeric日收益率 (单位:%)0.466246605
DataDateint日期20231229

(3) CNE1_Rates

字段格式释义样例
!Currencyvarchar币种CNY
USDxratenumeric美元汇率6.5
RFRate%numeric无风险收益率 基于 6 个月 shibor 收益率计算 (单位:%)2.53
DataDateint日期20231229

(4) CNE1D_100_Asset_Exposure

字段格式释义样例
sidvarchar股票代码000001.SZ
Factorvarchar因子MARKET
Exposureint股票对因子暴露度1
DataDateint日期20231229

(5) CNE1D_100_DlyFacRet

字段格式释义样例
!Factorvarchar因子MARKET
DlyReturnnumeric日收益率0.016697795
DataDateint日期20060105

(6) CNE1D_100_Covariance

字段格式释义样例
!Factor1varchar因子 1AIRLINE
Factor2varchar因子 2AGRICULTURE
VarCovarnumeric协方差26.53
DataDateint日期20220104

(7) CNE1D_100_Asset_Data

字段格式释义样例
sidvarchar股票代码000001.SZ
SpecRisk%numeric残差风险 (单位:%)11.09479345
DataDateint日期20231229

(8) CNE1D_100_ETF_Exposure

字段格式释义样例
sidvarcharETF 代码159150.SZ
DataDateint日期20231229
Factorvarchar因子AGRICULTURE
ExposurenumericETF 对因子暴露度0.059283241

:以上文件的 return 数值中,若单位标注为%,则以此为单位;否则以绝对数值为单位。

CNE1D_100_Factors(因子中英文名称映射表)

FactornameFactorGroupChinese_nameFactor_Group_Chinese
AGRAgriculture2-Industries农林牧渔行业
BASCHEMChemical2-Industries基础化工行业
STEELSteel2-Industries钢铁行业
METALNonferrous Metals2-Industries有色金属行业
ELECTRNElectronic Engineering2-Industries电子行业
AUTOAutomobile2-Industries汽车行业
HOMEAPPHome Appliances2-Industries家用电器行业
FOODBEVFood And Beverage2-Industries食品饮料行业
TEXTLAPPTextiles & Apparel2-Industries纺织服饰行业
LIGHTINDLight Manufacturing2-Industries轻工制造行业
PHARMBIOPharmaceutical Distribution2-Industries制药行业
BEAUTYCAREHealth Care2-Industries医疗器械行业
UTILITYPublic Utility2-Industries公用事业行业
TRANSPRTTransportation2-Industries地面交通行业
REALESTReal Estate2-Industries房地产行业
COMMERETCommercial Trade2-Industries商贸零售行业
SOCIASERSocial Services2-Industries社会服务行业
BANKBank2-Industries银行行业
FINANNon-banking financials2-Industries非银行业
CONGConglomerates2-Industries综合行业
BUILDMATBuilding materials2-Industries建筑材料行业
CONSTDECConstruction & Decoration2-Industries建筑装饰行业
ELECEQPElectrical Equipment2-Industries电力设备行业
CAPEQCapital Equipment2-Industries机械设备行业
DEFENCEDefence2-Industries国防军工行业
COMPUTERComputer2-Industries计算机行业
MEDIAMedia2-Industries传媒行业
COMMCommunications2-Industries通信行业
COALCoal2-Industries煤炭行业
PETROPetroleum and Petrochemical2-Industries石油石化行业
ENVIRPROEnvironmental Protection2-Industries环保行业
NEState-owned Enterprise1-Risk Indices央国企风格
ANLYSTSNAnalyst Sentiment1-Risk Indices分析师情绪风格
BETABeta1-Risk Indices贝塔风格
CROWDCrowd1-Risk Indices个股拥挤度风格
DIVYILDDividend Yield1-Risk Indices股息率风格
EARNQLTYEarning Quality1-Risk Indices盈利质量风格
EARNVAREarnings Varibility1-Risk Indices盈利波动率风格
GROWTHGrowth1-Risk Indices成长风格
INDMOMIndustry Momentum1-Risk Indices行业动量风格
INVSQLTYInvestment Quality1-Risk Indices投资质量风格
LEVERAGELeverage1-Risk Indices杠杆风格
LIQUIDITYLiquidity1-Risk Indices流动性风格
LTREVRSLLong-Term Reversal1-Risk Indices长期反转风格
MIDCAPMidcap1-Risk Indices中盘股风格
MLFACMachine Learning1-Risk Indices机器学习风格
MOMENTUMMomentum1-Risk Indices动量风格
OtherPrivate Enterprise1-Risk Indices民营企业风格
PROFITProfitability1-Risk Indices盈利能力风格
RESVOLResidual Volatility1-Risk Indices残差波动率风格
SEASONALITYSeasonality1-Risk Indices股价季节性风格
SIZESize1-Risk Indices大小盘风格
STREVRSLShort-Term Reversal1-Risk Indices短期反转风格
VALUEValue1-Risk Indices价值风格
MARKETMarket5-Market市场因子市场
上次更新:
邀请注册送VIP优惠券
分享下方的内容给好友、QQ群、微信群,好友注册您即可获得VIP优惠券
玩转qmt,上迅投qmt知识库