J'étudie les notes de cours de Larry Wasserman sur les statistiques qui utilisent Casella et Berger comme texte principal. Je travaille sur ses notes de cours ensemble 2 et je suis resté coincé dans la dérivation du lemme utilisé dans l'inégalité de Hoeffding (pp.2-3). Je reproduis la preuve dans les notes ci-dessous et après la preuve je montrerai où je suis coincé.
Lemme
Supposons que et que . Alors .
Preuve
Puisque , nous pouvons écrire comme une combinaison convexe de et , à savoir où . Par convexité de la fonction on a
Prenez les attentes des deux côtés et utilisez le fait pour obtenir
où , et . Notez que . Aussi pour tout .g ( u ) = - γ u + log ( 1 - γ + γ e u ) γ = - a / ( b - a ) g ( 0 ) = ggu>0
Selon le théorème de Taylor, il existe un tel que g ( u ) = g ( 0 ) + u g
D'où .
Je pourrais suivre la preuve jusqu'à
u,g(u),γ mais je n'arrive pas à comprendre comment dériver .
Réponses:
Je ne suis pas sûr d'avoir bien compris votre question. Je vais essayer de répondre: essayez d'écrire en fonction de : this est naturel car vous voulez une borne dans .u=t(b-a)e u 2
Aidé par l'expérience, vous saurez qu'il vaut mieux choisir de l'écrire sous la forme . Alors conduit à avec . e g ( u ) = - aeg(u) g ( u )
Est-ce le genre de chose que vous demandiez?
Edit: quelques commentaires sur la preuve
Passons maintenant à notre problème. Pourquoi est-il possible d'obtenir une borne ne dépendant que de ? Intuitivement, il s'agit simplement de redimensionner : si vous avez une borne pour le cas , alors la borne générale peut être obtenu en prenant . Pensez maintenant à l'ensemble des variables centrées avec le support de la largeur 1: il n'y a pas tellement de liberté, donc une borne comme devrait exister. Une autre approche consiste à dire simplement que par le lemme ci-dessus sur , puis plus généralement , qui ne dépend que de etu = t ( b - a ) X E ( et X) ≤s(t) b - a = 1 s ( t ( b - a ) ) s ( t )
E (ϕ(X) ) E(ϕ(tX))≤E(ϕ(tX0)) u γ : si vous fixez et , et que varient, il n'y a qu'un seul degré de liberté, et , , . On obtient
Il vous suffit de trouver une borne impliquant uniquement .u=u0=t0(b0−a0) γ=γ0=−a0b0−a0 t,a,b t=t0α a=αa0 b=αa0
Maintenant, nous sommes convaincus que cela peut être fait, cela doit être beaucoup plus facile! Vous ne pensez pas nécessairement à pour commencer. Le fait est que vous devez tout écrire en fonction de et . Notez d'abord que , , et . Puis Maintenant, nous sommes dans le cas particulier ... I pensez que vous pouvez terminer.g u γ
γ=−ab−a 1−γ=bb−a at=−γu bt=(1−γ)u
J'espère que je l'ai clarifié un peu.
la source