Comment écrire trycatch en R

342

Je veux écrire du trycatchcode pour faire face aux erreurs de téléchargement sur le Web.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

Ces deux instructions s'exécutent avec succès. Ci-dessous, je crée une adresse Web inexistante:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1]n'existe pas. Comment écrire une trycatchboucle (fonction) pour que:

  1. Lorsque l'URL est incorrecte, la sortie sera: "L'URL Web est incorrecte, impossible à obtenir".
  2. Lorsque l'URL est erronée, le code ne s'arrête pas, mais continue de télécharger jusqu'à la fin de la liste des URL?
Dd Pp
la source

Réponses:

626

Et bien: bienvenue dans le monde R ;-)

Voici

Configuration du code

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped insided a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

Appliquer le code

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

Examen de la sortie

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

Remarque additionnelle

tryCatch

tryCatchrenvoie la valeur associée à l'exécution exprsauf en cas d'erreur ou d'avertissement. Dans ce cas, des valeurs de retour spécifiques (voir return(NA)ci - dessus) peuvent être spécifiées en fournissant une fonction de gestionnaire respective (voir les arguments erroret warningdans ?tryCatch). Il peut s'agir de fonctions qui existent déjà, mais vous pouvez également les définir à l'intérieur tryCatch()(comme je l'ai fait ci-dessus).

Les implications du choix de valeurs de retour spécifiques des fonctions de gestionnaire

Comme nous l'avons spécifié qui NAdoit être retourné en cas d'erreur, le troisième élément de yis NA. Si nous avions choisi NULLd'être la valeur de retour, la longueur de yaurait simplement été 2au lieu de 3comme lapply()"ignorera" simplement les valeurs de retour qui le sont NULL. Notez également que si vous ne spécifiez pas de valeur de retour explicite via return(), les fonctions du gestionnaire retourneront NULL(c'est-à-dire en cas d'erreur ou de condition d'avertissement).

Message d'avertissement "indésirable"

Comme warn=FALSEcela ne semble pas avoir d'effet, une autre façon de supprimer l'avertissement (qui dans ce cas n'est pas vraiment intéressant) est d'utiliser

suppressWarnings(readLines(con=url))

au lieu de

readLines(con=url, warn=FALSE)

Expressions multiples

Notez que vous pouvez également placer plusieurs expressions dans la "partie des expressions réelles" (argument exprde tryCatch()) si vous les mettez entre crochets (comme je l'ai illustré dans la finallypartie).

Rappster
la source
Étant donné que la première chaîne de vos pastefonctions se termine par un espace, pourquoi ne pas omettre l'espace et le sep=""?
seancarmody
2
@seancarmody: true ;-) Je suis tellement habitué à assembler des chaînes plus longues / plus compliquées si je devais contrôler les espaces en les écrivant.
Rappster
3
Vous devez utiliser paste0pour cela!
seancarmody
6
paste0() est en base. En interne, les deux paste()et paste0()appelez do_pasteen paste.c . La seule différence est paste0()qu'il ne passe pas d' separgument.
jthetzel
1
@JulienNavarre: rappelez-vous que la "partie try" renvoie toujours le dernier objet ( readLines(con=url, warn=FALSE)qui est actuellement la chose réelle qui pourrait mal tourner). Donc, si vous vouliez ajouter un message, vous auriez besoin de stocker la valeur réelle de retour dans une variable: out <- readLines(con=url, warn=FALSE)suivi de message("Everything worked")suivi par outafin d'en faire le dernier objet qui est réellement retourné
Rappster
69

R utilise des fonctions pour implémenter le bloc try-catch:

La syntaxe ressemble un peu à ceci:

result = tryCatch({
    expr
}, warning = function(warning_condition) {
    warning-handler-code
}, error = function(error_condition) {
    error-handler-code
}, finally={
    cleanup-code
})

Dans tryCatch (), deux «conditions» peuvent être gérées: «avertissements» et «erreurs». La chose importante à comprendre lors de l'écriture de chaque bloc de code est l'état d'exécution et la portée. @la source

heretolearn
la source
5
Remplacer error-handler-codeparcat("web url is wrong, can't get")
seancarmody
2
vous avez laissé de côté le message
rawr
52

tryCatcha une structure de syntaxe légèrement complexe. Cependant, une fois que nous comprenons les 4 parties qui constituent un appel tryCatch complet comme indiqué ci-dessous, il devient facile de s'en souvenir:

expr : [ Obligatoire ] Code (s) R à évaluer

error : [ Facultatif ] Que doit-on exécuter si une erreur s'est produite lors de l'évaluation des codes dans expr

warning : [ Facultatif ] Que doit-on exécuter si un avertissement se produit lors de l'évaluation des codes dans expr

enfin : [ Facultatif ] Ce qui doit s'exécuter juste avant de quitter l'appel tryCatch, indépendamment du fait que expr s'est correctement exécuté, avec une erreur ou avec un avertissement

tryCatch(
    expr = {
        # Your code...
        # goes here...
        # ...
    },
    error = function(e){ 
        # (Optional)
        # Do this if an error is caught...
    },
    warning = function(w){
        # (Optional)
        # Do this if an warning is caught...
    },
    finally = {
        # (Optional)
        # Do this at the end before quitting the tryCatch structure...
    }
)

Ainsi, un exemple de jouet, pour calculer le journal d'une valeur, pourrait ressembler à:

log_calculator <- function(x){
    tryCatch(
        expr = {
            message(log(x))
            message("Successfully executed the log(x) call.")
        },
        error = function(e){
            message('Caught an error!')
            print(e)
        },
        warning = function(w){
            message('Caught an warning!')
            print(w)
        },
        finally = {
            message('All done, quitting.')
        }
    )    
}

Maintenant, en exécutant trois cas:

Un cas valide

log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.

Un cas "d'avertissement"

log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.

Un cas "d'erreur"

log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.

J'ai écrit sur quelques cas d'utilisation utiles que j'utilise régulièrement. Trouvez plus de détails ici: https://rsangole.netlify.com/post/try-catch/

J'espère que cela vous sera utile.

Rahul
la source
34

Voici un exemple simple :

# Do something, or tell me why it failed
my_update_function <- function(x){
    tryCatch(
        # This is what I want to do...
        {
        y = x * 2
        return(y)
        },
        # ... but if an error occurs, tell me what happened: 
        error=function(error_message) {
            message("This is my custom message.")
            message("And below is the error message from R:")
            message(error_message)
            return(NA)
        }
    )
}

Si vous souhaitez également capturer un "avertissement", ajoutez simplement warning=un error=élément similaire à la pièce.

Paul
la source
1
Devrait-il y avoir des accolades autour de la exprpièce, car il y a deux lignes au lieu d'une?
Paul
Merci! Après une double vérification, je ne vois aucun besoin de crochets
Paul
Merci pour la double vérification. Lorsque j'exécute votre code, je reçois Error: unexpected ')' in " )"et Error: unexpected ')' in " )". L'ajout d'une paire de crochets bouclés résout le problème.
Paul
Pour la plupart des cas d'utilisation, vous avez raison, merci! Il a été corrigé.
Paul
23

Comme je viens de perdre deux jours de ma vie à essayer de résoudre tryCatch pour une fonction irr, j'ai pensé que je devrais partager ma sagesse (et ce qui manque). FYI - irr est une fonction réelle de FinCal dans ce cas où il y a eu des erreurs dans quelques cas sur un grand ensemble de données.

  1. Configurez tryCatch dans le cadre d'une fonction. Par exemple:

    irr2 <- function (x) {
      out <- tryCatch(irr(x), error = function(e) NULL)
      return(out)
    }
  2. Pour que l'erreur (ou l'avertissement) fonctionne, vous devez réellement créer une fonction. À l'origine, pour la partie erreur, je viens d'écrire error = return(NULL)et toutes les valeurs sont revenues nulles.

  3. N'oubliez pas de créer une sous-sortie (comme ma "sortie") et de return(out).

James
la source
3
Pourquoi le numéro 3 est-il nécessaire?
jan-glx