J'ai un fichier JSON members.json
comme ci-dessous.
{
"took": 670,
"timed_out": false,
"_shards": {
"total": 8,
"successful": 8,
"failed": 0
},
"hits": {
"total": 74,
"max_score": 1,
"hits": [
{
"_index": "2000_270_0",
"_type": "Medical",
"_id": "02:17447847049147026174478:174159",
"_score": 1,
"_source": {
"memberId": "0x7b93910446f91928e23e1043dfdf5bcf",
"memberFirstName": "Uri",
"memberMiddleName": "Prayag",
"memberLastName": "Dubofsky"
}
},
{
"_index": "2000_270_0",
"_type": "Medical",
"_id": "02:17447847049147026174478:174159",
"_score": 1,
"_source": {
"memberId": "0x7b93910446f91928e23e1043dfdf5bcG",
"memberFirstName": "Uri",
"memberMiddleName": "Prayag",
"memberLastName": "Dubofsky"
}
}
]
}
}
Je veux l'analyser en utilisant un bash
script pour obtenir uniquement la liste des champs memberId
.
Le résultat attendu est:
memberIds
-----------
0x7b93910446f91928e23e1043dfdf5bcf
0x7b93910446f91928e23e1043dfdf5bcG
J'ai essayé d'ajouter le code bash + python suivant à .bashrc
:
function getJsonVal() {
if [ \( $# -ne 1 \) -o \( -t 0 \) ]; then
echo "Usage: getJsonVal 'key' < /tmp/file";
echo " -- or -- ";
echo " cat /tmp/input | getJsonVal 'key'";
return;
fi;
cat | python -c 'import json,sys;obj=json.load(sys.stdin);print obj["'$1'"]';
}
Et puis appelé:
$ cat members.json | getJsonVal "memberId"
Mais ça jette:
Traceback (most recent call last):
File "<string>", line 1, in <module>
KeyError: 'memberId'
python
, et nonbash
, c'est ce que vous utilisez pour analyser json. Par exemple, cette erreur est certainement une erreur python, pas une erreur bash.python
, ne signifie pas que son objectif est d'utiliserpython
Réponses:
Si vous utilisiez:
vous pouvez inspecter la structure du dicton imbriqué
obj
et voir que votre ligne d'origine doit se lire:à l'élément "memberId". De cette façon, vous pouvez conserver le Python comme un oneliner.
S'il y a plusieurs éléments dans l'élément "hits" imbriqué, alors vous pouvez faire quelque chose comme:
La solution de Chris Down est meilleure pour trouver une valeur unique pour des clés (uniques) à n'importe quel niveau.
Avec mon deuxième exemple qui imprime plusieurs valeurs, vous atteignez les limites de ce que vous devriez essayer avec une seule ligne, à ce stade, je vois peu de raisons de faire la moitié du traitement en bash, et je passerais à une solution Python complète .
la source
Une autre façon de faire cela dans bash est d'utiliser jshon . Voici une solution à votre problème en utilisant
jshon
:Les
-e
options extraient les valeurs du json. L'-a
itère sur le tableau et-u
décode la chaîne finale.la source
Eh bien, votre clé n'est clairement pas à la racine de l'objet. Essayez quelque chose comme ceci:
Cela a l'avantage de ne pas simplement injecter de la syntaxe dans Python, ce qui pourrait provoquer une rupture (ou pire, l'exécution de code arbitraire).
Vous pouvez alors l'appeler comme ceci:
la source
Une autre alternative est jq :
la source
Essaye ça:
Si vous avez déjà
pretty printed
json, pourquoi ne le faites-vous pasgrep
?Vous pouvez toujours obtenir un joli format imprimé avec du python simplejson
grep
.Utilisez les vidages:
Ensuite, il vous suffit
grep
de créer le résultat avec le modèle «memberId».Pour être tout à fait précis:
Usage:
la source
En suivant ce fil, j'utiliserais json.tool en python:
python -m json.tool members.json | awk -F'"' '/memberId/{print $4}'
la source
En utilisant deepdiff, vous n'avez pas besoin de connaître les clés exactes:
la source
Voici une solution bash.
find_members.sh
ajouter la ligne suivante au fichier + enregistrer
chmod +x find_members.sh
Maintenant, lancez-le:
la source