Statistiques et Big Data

22
Quand devrions-nous discrétiser / classer les variables / caractéristiques indépendantes continues et quand ne le devrions-nous pas?

Quand devrions-nous discrétiser / classer les variables / fonctionnalités indépendantes et quand ne le devrions-nous pas? Mes tentatives pour répondre à la question: En général, nous ne devons pas bin, car le binning perdra des informations. Le binning augmente en fait le degré de liberté du...

22
Entropie d'une image

Quelle est la façon correcte le plus théorique / physique-théorique de calculer l'entropie d'une image? Je ne me soucie pas de l'efficacité informatique en ce moment - je la veux théoriquement aussi correcte que possible. Commençons par une image en niveaux de gris. Une approche intuitive consiste...

22
Intuition du théorème de Bayes

J'ai essayé de développer une compréhension basée sur l'intuition du théorème de Bayes en termes de probabilité antérieure , postérieure , de probabilité et marginale . Pour cela, j'utilise l'équation suivante: où représente une hypothèse ou une croyance et représente des données ou des preuves....

22
Régression polynomiale brute ou orthogonale?

Je veux régresser une variable sur x , x 2 , … , x 5 . Dois-je le faire en utilisant des polynômes bruts ou orthogonaux? J'ai regardé la question sur le site qui traite de ces derniers, mais je ne comprends pas vraiment quelle est la différence entre les utiliser.

22
Quel est le but de l'autocorrélation?

Pourquoi l' autocorrélation est-elle si importante? J'en ai compris le principe (je suppose ..) mais comme il y a aussi des exemples où aucune autocorrélation ne se produit, je me demande: tout n'est pas dans la nature en quelque sorte autocorrélé? Le dernier aspect vise plus à une compréhension...

21
Coefficient de détermination (

Je veux saisir pleinement la notion de décrivant la quantité de variation entre les variables. Chaque explication Web est un peu mécanique et obtuse. Je veux "comprendre" le concept, pas seulement utiliser mécaniquement les chiffres.r2r2r^2 Par exemple: heures étudiées vs score au test rrr = 0,8...