Différence entre LOESS et LOWESS

17

Quelle est la différence entre LOESS et LOWESS? De Wikipedia, je peux seulement voir que LOESS est une généralisation de LOWESS. Ont-ils des paramètres légèrement différents?

pir
la source

Réponses:

19

Je pense qu'il est important de faire la distinction entre les méthodes et leurs implémentations dans les logiciels. La principale différence par rapport au premier est que le lowess ne permet qu'un seul prédicteur, tandis que le loess peut être utilisé pour lisser des données multivariées en une sorte de surface. Il vous donne également des intervalles de confiance. Dans ces sens, le loess est une généralisation. Alors que la valeur par défaut pour lowess est d'utiliser la pondération tricube, loess effectue un ajustement non pondéré par défaut.

Maintenant pour l'implémentation. Dans certains logiciels, lowess utilise un polynôme linéaire, tandis que loess utilise un polynôme quadratique (bien que vous puissiez modifier cela). Les valeurs par défaut et les raccourcis que les algorithmes utilisent sont souvent très différents, de sorte qu'il est difficile d'obtenir des sorties univariées pour correspondre exactement. D'un autre côté, je ne suis pas au courant d'un cas où le choix entre les deux a fait une différence de fond.

Dimitriy V. Masterov
la source
2
Papier LOWESS de Cleveland de 1979 dans JASA . a une pondération tricube pour cela. Il est explicitement mentionné à l'étape 4 sur p831 de «Régression pondérée localement robuste et diagrammes de diffusion de lissage», William S. Cleveland, Journal de l'American Statistical Association , Vol. 74 , n ° 368 . (Déc., 1979), p. 829-836. Si l'article de Wikipédia est exact, LOESS n'a pas changé cette valeur par défaut - ils le font tous les deux.
Glen_b -Reinstate Monica
Peut-être que ce n'est pas une utilisation standard après tout. Je suppose que Lowess utilise également généralement un polynôme linéaire, tandis que Loess utilise un polynôme quadratique.
Dimitriy V. Masterov
Quand est-ce que l'un est préféré à l'autre?
pir
8
Il peut être difficile de localiser précisément les différences, car le lowess a évolué au fil du temps, et le loess était simplement ce que Bill Cleveland a commencé à l'appeler après que certains géoscientifiques avec lesquels il parlait de lowess lui aient dit pourquoi cela leur rappelait le loess. Il a adopté le nouveau nom à ce moment-là, et ce qui était «typique» a continué à évoluer (légèrement) par la suite. Il y a plus de différences entre les options dans le document de 1979 que je mentionne plus haut qu'entre les implémentations typiques des deux. Nous devrons peut-être prendre deux points spécifiques le long de cette évolution pour identifier des différences spécifiques.
Glen_b -Reinstate Monica
6

Spécifiquement pour R, la différence est petite. Il y a une explication très détaillée ici: https://support.bioconductor.org/p/2323/

Mais notez que lowess () dans R affiche la liste des données tandis que loess () génère le modèle qui peut être entré dans Predict ().

Guangbo Chen
la source
1
la discussion dans le lien est excellente. il vous indique la relation exacte entre l'argument
cmo