Existe-t-il une approche algorithmique pour identifier les dates données dans un paragraphe en corrélation avec des événements (phrases) particuliers dans le paragraphe?
Exemple, considérons le paragraphe suivant:
En juin 1970, le grand chef prête serment. Mais ce n'est qu'après mai 1972, après la mort du ministre d'État, qu'il prend les rênes du pays. Bien qu'il ait bénéficié du soutien populaire jusqu'au milieu des années 1980, son influence a commencé à diminuer par la suite.
Existe-t-il un algorithme (déterministe ou stochastique) # qui peut générer un 2-tuple (date, événement), où l' événement est implicite, par le paragraphe, d'avoir eu lieu à la date ? Dans le cas ci-dessus:
- (Juin 1970, un grand leader a prêté serment)
(Mai 1972, prend les rênes)
ou mieux encore
- (Mai 1972, le grand leader reprend les rênes)
- (1980, chute d'influence)
# Plus tard
(<= May 1972, death of the Minister of State)
ou(<= Mid-1980, [the great leader] enjoyed popular support)
.Réponses:
En général, le problème de l'identification des dates et d'autres marqueurs temporels dans le texte est appelé le problème de l' extraction des références temporelles . La recherche liée vous amènera à des articles liés à cela.
la source
Puisque vous demandez une approche algorithmique, je serai aussi têtu qu'un algorithme. Je suis désolé de traiter cette question comme ceci, mais comme cela ne semble pas être un problème théorique complexe, je vais synthétiser les approches possibles.
Question: pouvez-vous me donner une définition algorithmique d'une date et d'un événement particulier?
Si vous le pouvez: Étant donné que votre définition est algorithmique, il s'agit probablement d'une sorte de grammaire formelle , et votre problème sera de régler cette grammaire pour prendre en compte tous les cas que vous devez prendre en compte. (Je suis intéressé si vous pouvez me donner une définition exacte qui n'est pas une grammaire formelle)
Si vous ne pouvez pas: alors au moins vous pouvez trouver des exemples. Très bien alors. La meilleure approche - et je ne peux que l'imaginer - est celle des algorithmes d'apprentissage automatique, que vous devrez vous entraîner afin de reconnaître vos dates puis vos événements. (Utilisation d'un corpus de phrases annotées à la main) Cependant, cela est assez exagéré par rapport à une grande expression rationnelle faite à la main qui fera probablement le travail. Si vous voulez vraiment, vraiment le faire, je pense que le plus efficace sera ce type d'expression régulière donné en paramètre à l'algorithme d'apprentissage, mais vous feriez mieux de demander à des experts en apprentissage automatique.
Bonne chance avec ça, c'est beaucoup plus simple d'en parler (dans les deux cas).
la source