+-

也许有人可以帮助我.我试图将以下内容平放到pandas数据帧中:
[{u'_id': u'2',
u'_index': u'list',
u'_score': 1.4142135,
u'_source': {u'name': u'name3'},
u'_type': u'doc'},
{u'_id': u'5',
u'_index': u'list',
u'_score': 1.4142135,
u'_source': {u'dat': u'2016-12-12', u'name': u'name2'},
u'_type': u'doc'},
{u'_id': u'1',
u'_index': u'list',
u'_score': 1.4142135,
u'_source': {u'name': u'name1'},
u'_type': u'doc'}]
结果应如下所示:
|_id | _index | _score | name | dat | _type |
------------------------------------------------------
|1 |list |1.4142..| name1| nan | doc |
|2 |list |1.4142..| name3| nan | doc |
|3 |list |1.4142..| name1| 2016-12-12 | doc |
但我所做的一切都无法获得理想的结果.
我使用过这样的东西:
df = pd.concat(map(pd.DataFrame.from_dict, res['hits']['hits']), axis=1)['_source'].T
但后来我放松了_source字段之外的类型.
我也尝试过
test = pd.DataFrame(list)
for index, row in test.iterrows():
test.loc[index,'d'] =
但我不知道如何使用字段_source并将其附加到原始数据框.
有人知道如何做到这一点并成为理想的结果吗?
最佳答案
使用
json_normalize:
from pandas.io.json import json_normalize
df = json_normalize(data)
print (df)
_id _index _score _source.dat _source.name _type
0 2 list 1.414214 NaN name3 doc
1 5 list 1.414214 2016-12-12 name2 doc
2 1 list 1.414214 NaN name1 doc
点击查看更多相关文章
转载注明原文:python – 从嵌套的json列表中展平Pandas DataFrame - 乐贴网