J'essaie, pour mes propres besoins d'apprentissage, de développer une implémentation d'un algorithme qui répertorierait les livres, étant donné une image d'une étagère comme celle-ci:
La première étape consiste à découper l'image en livres individuels.
Mon algorithme, dans Mathematica , est:
img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
- faire une détection de bord de base et
supprimez le texte et essayez de garder les longues lignes
edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
puis supprimez les lignes horizontales indésirables
lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
Cependant, les résultats sont loin d’être excellents:
Mes questions sont:
- Comment puis-je améliorer cela pour obtenir de meilleurs résultats?
- Existe-t-il un moyen plus intelligent de le faire?
- dans quelle mesure dois-je traiter les images pour augmenter la précision lors de la phase OCR (ultérieure)?
- Comment utiliser les informations de couleur pour améliorer la segmentation?
opencv
computer-vision
image-segmentation
Oren Pinsky
la source
la source
Réponses:
Voici le lien vers un document de recherche qui essaie de faire la même chose que vous vouliez. Cela pourrait vous aider. en utilisant les fonctionnalités d'image Aussi une vidéo sympa sur youtube
la source
Quelle méthode utilisez-vous pour détecter les lignes? Avez-vous essayé d'expérimenter le LSD ?
Voici les résultats d'un test rapide que j'ai fait avec du LSD:
La deuxième image est le résultat avec la même contrainte d'angle mais sans tenir compte des longueurs des segments:
Vous pouvez essayer de jouer un peu avec cela, comprendre comment choisir les meilleurs segments de ligne, les étendre aux lignes et peut-être obtenir des résultats légèrement meilleurs que ceux que vous avez publiés.
la source
Vous pouvez essayer de faire la détection des contours sur des domaines de couleurs individuels, puis les fusionner, en utilisant la méthode de votre choix pour la détection des contours.
Par rapport à la détection des contours directement sur l'image couleur, elle pourrait produire de meilleurs résultats.
la source
Le papier du lien brisé fourni par isrish pourrait être trouvé Combiner les caractéristiques d'image et de texte: une approche hybride de la reconnaissance de la colonne vertébrale des livres mobiles , Proc. 19e conférence internationale ACM sur le multimédia, 2011. On peut également consulter d'autres articles de David Chen et al. , par exemple le suivi des actifs à faible coût à l'aide de téléphones avec caméra de localisation , Proc. SPIE 2010.
la source