ArXiv est-il populaire dans la communauté des statistiques?

25

Je sais que les communautés de physique et de mathématiques sont très impliquées dans ArXiv, mais qu'en est-il de la communauté des statistiques? Est-il habituel de poster là-bas avant la soumission?

StasK
la source
Je n'y ai jamais posté et je ne me souviens pas non plus y avoir cherché des papiers.
Christoph Hanck
@DeepNorth oui, ce serait intéressant. Je demande à la fois par curiosité et parce que j'ai récemment posté un brouillon "tel que soumis" sur ArXiv. Je me demandais si cela atteindrait vraiment des globes oculaires supplémentaires ...
1
Oui; certains d'entre nous regardent arXiv au moins une partie du temps. Je le fais quand je le peux ou quand quelqu'un me pointe là-bas, et j'associe souvent les gens aux journaux là-bas.
Glen_b -Reinstate Monica
3
Définissez les "statistiques". Dans le domaine où je travaille, la méthodologie de l'enquête, mes chercheurs sans doute naïfs pour «enquête complexe» et «population finie» ont apporté respectivement 2 et 42 résultats sur arXiv. Chaque année, la Section des méthodes de recherche sur les sondages de l'American Statistical Association organise environ 40 sessions aux Joint Statistical Meetings, entre 1 et 3 dans chaque plage horaire pendant les 4 jours de la conférence, et produit en conséquence au moins une centaine d'articles de compte rendu. Pour autant que je sache, rien de tout cela ne parvient à arXiv.
StasK

Réponses:

19

Oui, Arxiv est populaire dans la communauté des statistiques et de la science des données.

Alors que le monde des statistiques et de la science des données évolue tous les jours, il est important que les statisticiens et les scientifiques des données se tiennent au courant des derniers événements, techniques et algorithmes.

Il n'est peut-être pas aussi populaire que dans la communauté de la physique, mais il a sa part d'importance dans le monde riche en données.

Vous pourriez être intéressé par Gitxiv , qui rassemble des recherches de pointe avec le code / les bibliothèques open source correspondantes.

Dawny33
la source
3
+1 pour le lien vers Gitxiv ... mal jeter un oeil. Consultez-vous régulièrement ArXiv ou abonnez-vous à l'une de ses listes de diffusion?
2
Mon plaisir. Gitxiv a rapproché un peu plus le monde de la recherche du monde des statistiques et de l'informatique. Bravo à ces gars. Non, je ne m'abonne pas aux listes de diffusion, mais comme la plupart des articles sur l'apprentissage automatique et l'analyse s'y trouvent, je les vérifie chaque semaine.
Dawny33
3
Il serait préférable que vous incluiez des preuves à l'appui. Maintenant, ce n'est qu'un mot "Oui", et le reste n'est pas informatif (mais Gitxiv est intéressant, merci de l'avoir mentionné).
Richard Hardy
19

Je donnerai une réponse définitive et fondée sur des preuves. La réponse est oui.

Regardez les statistiques de Google Scholar pour les probabilités et les statistiques, les 10 principales sources par indice h5:

    Publication                               h5-index  h5-median
1.  Journal of Econometrics                         62  93
2.  The Annals of Statistics                        58  81
3.  arXiv Statistics Theory (math.ST)               57  80
4.  Journal of Statistical Software                 53 113
5.  arXiv Probability (math.PR)                     53  65
6.  arXiv Methodology (stat.ME)                     48  69
7.  Journal of the American Statistical Association 48  66
8.  Statistics in Medicine                          42  62
9.  Computational Statistics & Data Analysis        40  51
10. Journal of Business & Economic Statistics       39  67

Remarque, cette liste n'est pas basée sur le nombre de publications, elle est basée sur l' index de citation .

L'indice de citation de Google devient aussi populaire que Scopus et Reuters (ok, je n'ai pas de preuve de cette déclaration), donc ma réponse est aussi objective que possible.

Comparez cela à la liste de Scimagojr.com sur les statistiques et les probabilités:

    Title   Type    SJR H index Total Docs. (2014)  Total Docs. (3years)    Total Refs. Total Cites (3years)    Citable Docs. (3years)  Cites / Doc. (2years)   Ref. / Doc. Country
1   Annals of Mathematics   j   Q1  8,551   72  46  209 1.572   647 207 3,05    34,17   US
2   Vital and health statistics. Series 10, Data from the National Health Survey    k   Q1  7,801   30  4   7   55  125 7   16,33   13,75   US
3   Journal of the Royal Statistical Society. Series B: Statistical Methodology j   Q1  6,148   90  45  99  1.507   547 94  3,09    33,49   GB
4   Annals of Statistics    j   Q1  5,602   103 64  296 2.099   809 287 2,25    32,80   US
5   Journal of Statistical Software j   Q1  5,003   64  67  220 2.540   1.364   220 3,91    37,91   US
6   Journal of the American Statistical Association j   Q1  4,162   123 106 408 3.501   907 373 1,85    33,03   US
7   Probability Surveys j   Q1  3,645   22  1   20  84  46  19  2,73    84,00   US
8   Bioinformatics  j   Q1  3,576   248 809 2.145   18.801  11.329  2.089   4,69    23,24   GB
9   Journal of Business and Economic Statistics j   Q1  3,496   66  58  146 1.464   384 139 2,21    25,24   US
10  Biometrika  j   Q1  3,342   83  58  233 1.485   369 229 1,28    25,60   GB

Il y a un bon chevauchement avec la liste des 10 meilleurs de Google Scholar, comme vous pouvez le voir. Cette dernière liste est également basée sur l'indice h, mais ce n'est pas la citation de Google. Cela ne fait que valider l'ancien tableau et ses conclusions: arXiv est populaire parmi les statisticiens du monde universitaire.

SSRN est un autre endroit pour vider les préimpressions. C'est populaire parmi les économétriciens.

Aksakal
la source
+1 - Excellent travail en utilisant les métriques Google! L'indice h le place définitivement là-haut.
@Bey, une chose à savoir: le mouvement d'accès ouvert. arXiv est l'endroit où les gens jettent leurs pré-impressions, c'est ainsi que tout a commencé en physique. Ainsi, vous allez voir le même papier dans arXiv puis plus tard dans Phys Rev, par exemple. Ainsi, arXiv a d'abord été créé pour diffuser plus rapidement la recherche. Les bons papiers n'apparaissent généralement pas exclusivement sur arXiv.
Aksakal
Oui. Je ne cite généralement un article que je trouve sur ArXiv que si je le trouve également dans une revue à comité de lecture. Mon document est là pendant qu'il subit une révision et une mauvaise mise à jour avec la préimpression acceptée après la période d'embargo (en supposant qu'il n'est pas rejeté).
@Bey, pendant que nous y sommes, il y a deux autres endroits où vous pouvez vider vos préimpressions: RePec et SSRN. Les économétriciens pourraient les utiliser plus souvent qu'arXiv
Aksakal
14

Ce n'est pas une question d'opinion personnelle, alors regardons quelques chiffres sur les termes apparaissant sur les pages arXiv (quelques requêtes Google aléatoires avec peu de termes spécifiques au domaine):

site de validation croisée: arxiv.org renvoie

Environ 17 800 résultats

site de monte carlo: arxiv.org revient

Environ 187 000 résultats

site d'échantillonnage: arxiv.org renvoie

Environ 141 000 résultats

site de prévisions: arxiv.org renvoie

Environ 11 300 résultats

site de régression: arxiv.org revient

Environ 51100 résultats

MODIFIER

Comme @Scortchi l'a remarqué, arXiv publie ses propres statistiques. la catégorie stat apparaît dans les rapports des trois dernières années comme suit:

year submissions % submissions
2014 2025        2.2% 
2013 1602        1.7%
2012 1284        1.5%

Cependant, cela peut ne pas représenter entièrement le contenu des articles publiés, car certains d'entre eux peuvent être fortement liés aux statistiques, mais être marqués comme un domaine différent (par exemple, mathématiques ou cs ).

En outre, le blog de Xi'an pourrait se présenter comme une étude de cas. Il écrit beaucoup sur les statistiques bayésiennes et mentionne souvent des articles arXived (ayant leur propre étiquette ).

Il semble également que nous ayons mentionné "arXiv" sur CrossValidated dans 689 articles et commentaires jusqu'à présent (y compris ici).

Est-ce que cela le rend populaire ou non? Difficile à dire, mais il est certain que des milliers d'articles liés aux statistiques ont été publiés sur arXiv et sa popularité ne cesse de croître.

Tim
la source
3
Ou au moins, des milliers d'articles utilisant / mentionnant la méthodologie statistique
Glen_b -Reinstate Monica
@Glen_b oui, c'est une question de mots-clés à vérifier, mais je ne vois pas de meilleur moyen de vérifier s'il est "populaire".
Tim
4
Les «statistiques» sont un domaine sur arXiv - avec 7 711 soumissions à la fin de 2014, 0,9% du total. arxiv.org/help/stats/2014_by_area/index
Scortchi - Réintégrer Monica
@Scortchi Je n'ai jamais creusé aussi profondément dans ce site, merci!
Tim
+1 :) Je n'imaginais pas cette question comme un exercice d'analyse ... mais vous avez trouvé un moyen d'y arriver ... c'est très cool :) Je ne m'attendrais pas à moins de la part des gens sur ce site! Je dirais qu'en fonction de @Aksakal et de votre analyse, ArXiv est raisonnablement bien abonné aux statistiques :-)
8

Toutes les revues publiées par l'Institute of Mathematical Statistics (IMS) - et cela inclut The Annals of Statistics (l'une des toutes meilleures revues de statistiques), The Annals of Applied Statistics , etc. - encouragent explicitement les auteurs à préimprimer arXiv et de plus, veillez également à mettre des postprints sur arXiv. Je ne suis en fait au courant d'aucune revue de mathématiques ou de physique qui télécharge des articles sur arXiv si les auteurs ne l'ont pas fait eux-mêmes!

L'IMS encourage tous les membres à publier leurs articles sur arXiv.

( http://www.imstat.org/publications/arxiv.html )

Tous les articles IMS 2004 et suivants sont disponibles gratuitement dans un format post-impression sur arXiv, ainsi que les articles publiés par les auteurs.

ArXiv est un serveur d'archives et de distribution électronique entièrement automatisé et à accès ouvert pour les articles de recherche, maintenant détenu et exploité par l'Université Cornell et partiellement financé par la NSF. Les principaux domaines couverts sont la physique, les mathématiques, les sciences non linéaires, l'informatique et la biologie quantitative. Récemment, arXiv a coopéré avec IMS et la Bernoulli Society pour ouvrir une nouvelle catégorie de statistiques en mathématiques. Nous nous attendons à ce que cette catégorie finisse par devenir une archive de haut niveau comparable, par exemple, aux mathématiques et à la physique.

( http://www.imstat.org/publications/eaccess.htm )

amibe dit réintégrer Monica
la source