Applicabilité de la thèse de Church-Turing aux modèles de calcul interactifs

38

Paul Wegner et Dina Goldin publient depuis plus de 10 ans des articles et des livres dans lesquels ils affirment principalement que la thèse de Church-Turing est souvent mal représentée dans la communauté CS Theory et ailleurs. Autrement dit, il est présenté comme englobant tout le calcul, alors qu’il s’applique en fait au calcul de fonctions, qui est un très petit sous-ensemble de tout le calcul. Au lieu de cela, ils suggèrent que nous devrions chercher à modéliser le calcul interactif, où la communication avec le monde extérieur a lieu pendant le calcul.

La seule critique que j'ai vue de ce travail se trouve dans le forum Lambda the Ultimate , où quelqu'un a déploré ces auteurs pour avoir publié en permanence ce qui est évidemment connu. Ma question est donc la suivante: existe-t-il d'autres critiques dans cette ligne de pensée, et en particulier dans leurs Machines de Turing persistantes? Et si non, pourquoi alors semble-t-il très peu étudié (je pourrais me tromper). Enfin, comment la notion d'universalité se traduit-elle en un domaine interactif?

zenna
la source
ps: vous voudrez peut-être aussi jeter un coup d’œil à cette question sur l’hyper-calcul.
Kaveh
6
Voici une autre question similaire .
Dave Clarke
7
Je pense qu'Andrej et Neel ont expliqué ici que la réponse est négative pour les problèmes de calcul de fonction de type supérieur. Donc, la thèse de Church-Turing concerne essentiellement des problèmes de calcul de fonctions numériques . Les équivalences habituelles entre les modèles de calcul ne sont pas valables pour les types les plus élevés. (. Cependant, si je comprends bien, cela est plus sur les mécanismes d'interaction et la façon dont les objets de type supérieur sont représentés que de la puissance de calcul des modèles) (reposter pour fixer quelques fautes de frappe)
Kaveh
7
Je suis d'accord avec Kaveh.
Andrej Bauer
En fait, le premier article dans ce sens semble remonter à 1996-1997, "Pourquoi l'interaction est plus importante que les algorithmes" ou "Le changement de paradigme des algorithmes à l'interaction". plus tard dans l'article, il est fait référence à la grotte Platos, "le tarpit de Turing" (?), Critique Kants de la raison pure, la logique dialectique de Marx, Descartes, Penrose, Searle. alors peut-être devrait-il être considéré comme étant à la limite de la philosophie et pas tellement dans le sens du TCS technique / mathématique. pas de maths, pas de lemmes ou de preuves ou thms. alors qu'il est peut-être un peu grandiose, il cherche sérieusement à comprendre "la grande image" de la thèse de CT par rapport à l'histoire, etc.
vzn

Réponses:

75

Voici mon analogie préférée. Supposons que j'ai passé une dizaine d'années à publier des livres et des articles en arguant que, contrairement au dogme de l'informatique théorique, la thèse de Church-Turing ne parvient pas à capturer tous les calculs, car les machines de Turing ne peuvent pas faire griller du pain . Par conséquent, vous avez besoin de mon nouveau modèle révolutionnaire , le TETM (Toaster-Enhanced Turing Machine), qui permet le pain comme entrée possible et comprend le grillage comme opération primitive.

Vous pourriez dire: bien sûr, j'ai un «point», mais c'est totalement inintéressant. Personne n'a jamais prétendu qu'une machine de Turing pouvait gérer toutes les interactions possibles avec le monde extérieur sans la connecter d'abord à des périphériques appropriés. Si vous souhaitez qu'une MT grille le pain, vous devez le connecter à un grille-pain. alors le TM peut facilement gérer la logique interne du grille-pain (à moins que ce grille-pain particulier ne nécessite de résoudre le problème d'arrêt ou quelque chose du genre pour déterminer le brunissement du pain!). De la même manière, si vous souhaitez qu'une MT gère la communication interactive, vous devez la relier à des dispositifs de communication appropriés, comme Neel l'a expliqué dans sa réponse. Dans les deux cas, nous ne disons rien de ce qui n'aurait pas été évident pour Turing lui-même.

Donc, je dirais que la raison pour laquelle il n'y a pas eu de "suivi" des diatribes de Wegner et Goldin est que TCS a su modéliser l'interactivité à tout moment, et l'a fait avec plaisir, depuis le tout début du champ.

Mise à jour (8/30): Un point connexe est le suivant. Cela ne fait-il jamais oublier aux critiques que, ici, dans la Tour d'ivoire de l'église élite-Turing (l'ECTIT), les principaux thèmes de recherche des deux dernières décennies incluent les preuves interactives, les protocoles cryptographiques à plusieurs parties, les codes de communication interactive, les protocoles asynchrones de routage , consensus, propagation de rumeurs, élection des dirigeants, etc., et le prix de l'anarchie dans les réseaux économiques? Si placer la notion de calcul de Turing au centre du champ rend si difficile la discussion sur l'interaction, comment se fait-il que peu d'entre nous l'aient remarqué?

Autre mise à jour: Permettez-moi de poser une question extrêmement simple aux personnes qui continuent à taper du tambour sur le fait que les formalismes de niveau supérieur sont beaucoup plus intuitifs que les MT, et que personne ne pense en termes de MT à la pratique. Qu'est-ce qui fait que tous ces langages de haut niveau existent en premier lieu, garantissant qu'ils peuvent toujours être compilés en code machine? Est-ce que ce pourrait être ... euh ... LA THESE DE L'EGLISE , la même que celle sur laquelle vous vous lamentez? Pour clarifier, la thèse de l'Église de Turing ne prétend pas que "TURING MACHINEZ RULE !!" C'est plutôt l'affirmation que tout langage de programmation raisonnable aura un pouvoir expressif équivalent à celui des machines de Turing - et par conséquent, que vous pourriez aussi bien penser en termes de langages de haut niveau s’il est plus pratique de le faire. Bien entendu, il s’agissait d’une idée radicalement nouvelle il ya 60 à 75 ans.

Mise à jour finale: j'ai créé un blog pour une discussion plus approfondie de cette réponse.

Scott Aaronson
la source
8
Il existe une différence substantielle entre les grille-pain et les interactions: chaque modèle de calcul comporte un mécanisme d’IO. Les grille-pain n'apparaissent que rarement. Certains modèles de calcul modèle naïf: par exemple, les machines de Turing ne traitent que de manière informelle. Ce n’est pas un problème lorsque le calcul est considéré comme fonctionnel, c’est-à-dire commençant par une entrée et se terminant par une sortie, comme c’est le cas avec les machines de Turing. Cependant, cela devient naïvement fastidieux lorsque vous souhaitez traiter de véritables phénomènes concurrents, par exemple, quand deux calculs interactifs sont-ils égaux? (Suite ci-dessous.)
Martin Berger
12
Au cas où mes vues ne seraient pas encore assez claires, j'ajouterais que je trouve l'ensemble de la littérature sur le "mythe de la thèse de Turing-l'Église" non seulement exaltante, mais (plus précisément) terriblement stérile en idées. La lire apporte toute la joie de lire quelqu'un prétendant réfuter la physique newtonienne, non pas à cause de quelque chose d'aussi cool que la mécanique quantique ou la relativité, mais parce que "les lois de Newton ignorent les frictions" . Ou écoutez un enfant expliquer pourquoi elle a techniquement gagné un jeu de société parce qu'elle a déplacé les pièces pendant que vous partiez pour aller aux toilettes.
Scott Aaronson
7
Je pense que la citation de Lance Fortnow extraite ci-dessous dans la réponse de vzn (article original ici: ubiquity.acm.org/article.cfm?id=1921573 ) montre qu’au moins quelques personnes sensées soutiennent la thèse "Strong". Fortnow affirme que la thèse de CT peut être "simplement énoncée" comme "tout ce qui est calculable est calculable par une machine de Turing", écrivant "tout" où il aurait vraiment dû écrire "chaque ". F:NN
Noam Zeilberger
10
comment pouvons-nous débattre au sujet d'une prétendue thèse baptisée du nom de Turing et de l'Église, aucune d'entre elles n'ayant déclaré dans sa propre écriture la thèse telle qu'elle a été interprétée et évoluée par la suite? - Voir aussi: formule d'Euler, élimination gaussienne, algorithme d'Euclide, théorème de Pythagore.
Jeffε
14
vingt commentaires! scott a réussi à transformer une réponse de synthèse à un article de blog optimisé pour Shtetl ...
Sasho Nikolov
35

Je pense que le problème est assez simple.

  1. Tous les formalismes interactifs peuvent être simulés par les machines de Turing.

  2. Les MT sont des langages peu pratiques pour la recherche sur le calcul interactif (dans la plupart des cas) car les problèmes intéressants sont noyés dans le bruit des encodages.

  3. Tous ceux qui travaillent sur la mathématisation de l'interaction le savent.

Laissez-moi vous expliquer cela plus en détail.

Les machines de Turing peuvent évidemment modéliser tous les modèles informatiques interactifs existants dans le sens suivant: choisissez un codage de la syntaxe appropriée sous forme de chaînes binaires, écrivez une MT prenant en entrée deux programmes interactifs codés P, Q (dans un modèle choisi de calcul interactif). et retourne vrai exactement quand il y a une réduction en une étape de P à Q dans le système de réécriture du terme approprié (si votre calcul a une relation de transition ternaire, procédez mutatis mutandis). Donc, vous avez une MT qui effectue une simulation étape par étape du calcul dans le calcul interactif. Il est clair que le pi-calcul, le calcul ambiant, le CSC, le CSP, les réseaux de Petri, le pi-calcul chronométré et tout autre modèle de calcul interactif étudié peuvent être exprimés dans ce sens. C'est ce que les gens veulent dire quand ils disent que l'interaction ne va pas au-delà des MT.

N. Krishnaswami fait référence à une deuxième approche de la modélisation de l'interactivité à l'aide de bandes Oracle. Cette approche est différente de l'interprétation de la relation réduction / transition ci-dessus, car la notion de MT est modifiée: nous passons de MT simples à des MT avec des bandes Oracle. Cette approche est populaire dans la théorie de la complexité et la cryptographie, principalement parce qu'elle permet aux chercheurs de ces domaines de transférer leurs outils et leurs résultats du monde séquentiel vers le monde concurrent.

Le problème avec les deux approches est que les problèmes théoriques de concurrence réelle sont obscurcis. La théorie de la concurrence cherche à comprendre l'interaction comme un phénomène sui generis. Les deux approches via les MT remplacent simplement un formalisme commode pour exprimer un langage de programmation interactif avec un formalisme moins commode.

Dans aucune des deux approches, les problèmes théoriques de concurrence simultanée ne sont véritablement centrés sur la représentation directe de la communication et de son infrastructure. Ils sont là, visibles à l'œil entraîné, mais codés, cachés dans le brouillard impénétrable de la complexité de la codification. Les deux approches sont donc mauvaises pour la mathématisation des préoccupations clés du calcul interactif. Prenons par exemple ce qui pourrait être la meilleure idée de la théorie des langages de programmation au cours des cinquante dernières années, l'axiomatisation de l'extrusion de la portée de Milner et al. (Qui constitue une étape clé dans une théorie générale de la compositionalité):

P|(νX)Q  (νX)(P|Q)à condition de XFv(P)

Cette idée est merveilleusement simple lorsqu'elle est exprimée dans un langage sur mesure tel que le pi-calcul. Faire cela en utilisant l'encodage de pi-calcul dans les MT remplirait probablement 20 pages.

En d’autres termes, l’invention de formalismes explicites d’interaction a apporté les contributions suivantes à l’informatique: axiomatisation directe des primitives de clé de la communication (opérateurs d’entrée et de sortie, par exemple) et mécanismes de prise en charge (création de nouveaux noms, composition parallèle, etc.) . Cette axiomatisation est devenue une véritable tradition de recherche avec ses propres conférences, écoles, terminologie.

Une situation similaire existe en mathématiques: la plupart des concepts pourraient être écrits en utilisant le langage de la théorie des ensembles (ou théorie des topos), mais nous préférons la plupart du temps des concepts de niveau supérieur tels que groupes, anneaux, espaces topologiques, etc.

Martin Berger
la source
1
+1 pour expliquer les systèmes de calcul interactifs puissants et puissants du modèle TM (il peut les simuler).
Kaveh
3
Si seulement je pouvais voter ceci plusieurs fois.
Vijay D
26

NN

Cependant, il est toujours vrai que les machines de Turing sont assez pénibles pour la modélisation de propriétés telles que l’interactivité. La raison est un peu subtile, et a à voir avec le genre de questions que nous voulons poser sur les calculs interactifs.

La première étape habituelle lors de la modélisation de l’interaction avec les MT consiste à utiliser des bandes Oracle. Intuitivement, vous pouvez considérer la chaîne imprimée sur le ruban Oracle comme une "prédiction" de l'interaction d'E / S de la machine de Turing avec l'environnement. Cependant, considérons le type de questions que nous voulons poser sur les programmes interactifs: par exemple, nous voudrions savoir qu'un programme informatique ne produira pas vos données financières à moins qu'il ne reçoive votre nom d'utilisateur et votre mot de passe, et que les programmes ne fuient pas informations sur les mots de passe. Parler de ce type de contrainte est très pénible avec les cordes oracle, car il reflète une contrainte temporelle et épistémique sur la trace de l'interaction, et la définition des bandes oracle vous demande de fournir la chaîne entière à l'avant.

Je suppose que ce droit est faisable et revient essentiellement à (1) considérer les chaînes oracle non pas comme un ensemble, mais comme un espace topologique dont les ensembles ouverts codent la logique modale du temps et des connaissances que vous souhaitez modéliser, et (2) en assurant que les théorèmes que vous établissez soient tous continus par rapport à cette topologie, en considérant les prédicats comme des fonctions continues allant des chaînes oracle aux valeurs de vérité considérées comme l’espace de Sierpinski. Je devrais souligner que c'est une hypothèse , basée sur l'analogie avec la théorie des domaines. Pour en être sûr, vous devez vous occuper des détails (et probablement les soumettre à LICS ou quelque chose du genre).

En conséquence, les gens préfèrent modéliser les interactions en utilisant des éléments tels que le modèle Dolev-Yao , dans lequel vous modélisez explicitement les interactions entre les ordinateurs et l'environnement, afin de pouvoir explicitement caractériser ce que l'attaquant sait. Cela facilite beaucoup la formulation de logiques modales appropriées pour le raisonnement sur la sécurité, car l'état du système et l'état de l'environnement sont représentés explicitement.

Neel Krishnaswami
la source
1

En lisant le blog de Lance Fortnows, je viens de parcourir cet article récent / sympa / long de l'enquête sur le sujet avec de nombreuses perspectives et références [1] (qui n'a pas été citée jusqu'à présent), qui inclut la perspective de Wegner / Goldin (parmi beaucoup d'autres). Ill suffit de citer Fortnows excellent / résumé emphatique / déclaration / affirmation de la ligne quasi officielle / uniforme / unanime du parti du SDC:

"Quelques informaticiens tentent néanmoins de faire valoir que la thèse de [Church-Turing] ne parvient pas à capturer certains aspects du calcul. Certains d'entre eux ont été publiés dans des lieux prestigieux tels que Science, Communications of the ACM, et ACM Ubiquity. Certaines personnes en dehors de l'informatique pourraient penser qu'il existe un débat sérieux sur la nature du calcul. Il n'y en a pas. "

[1] Turings Titanic Machine de Barry S Cooper, CACM, volume 55

vzn
la source
-4

Je suis tout à fait d'accord avec les commentaires d'Aaronson.

Je ne comprends pas le travail de Milner. (par exemple, pi calcul, que Milner a inventé pour décrire les processus de communication). Cela me semble tout à fait illisible, de même que presque tous les articles sur les mathématiques et la logique, tels que les théories de Lambek. Je ne doute pas que les idées de Lambek soient très bonnes, mais j'aimerais les voir traduites dans une sorte d'anglais pidgin que je peux lire.

Le commentaire de Milner me fait penser que le lambda calcul est bien pour les "processus séquentiels" mais que quelque chose de plus est nécessaire pour les processus de communication.

Mon point de vue (peut-être naïf) était qu'il ne pouvait en être ainsi, car le pi-calcul est complet de Turing et peut donc être converti mécaniquement en une autre notation de Turing-complète, le lambda calcul. Par conséquent, la notation pi-calcul de Milner peut être convertie automatiquement en calcul lambda.

Il semble que j'ai identifié un projet: intuitivement, il devrait être possible de convertir mécaniquement d'un langage complet de Turing à un autre. Y a-t-il un algorithme pour le faire? Je vais devoir regarder sur Google. C’est peut-être incroyablement difficile à faire et aussi difficile que le problème d’arrêt.

J'ai regardé hier sur le net et j'ai trouvé des articles sur des modèles de calcul lambda. Je suis surpris de constater que cela semble être un trou de lapin très profond.

Richard Mullins

richard mullins
la source
-7

Voici la chose, une fois que vous ajoutez de l'interactivité (pure), la formalité sort de la fenêtre. Ce n'est plus un système "fermé". La question est alors de savoir quelle est la notion de calcul une fois que l’interactivité entre en jeu. Cette réponse: eh bien, soit l’autre utilisateur / machine substitue une partie de votre calcul (qui peut être mémorisée par une autre machine encore plus grande, plus grande), ou vous n'êtes plus dans un système formellement définissable et vous jouez maintenant. un jeu , auquel cas il n'y a pas d'application de la thèse de Church-Turing.

Le docteur
la source
2
Les modèles interactifs de calcul, tels que les calculs de processus, sont des jeux au sens de la sémantique du jeu .
Martin Berger
1
Le comportement humain n'est pas pertinent. Ce qui compte, c'est que les dispositifs interactifs calculables agissent de manière algorithmique et mécanique sur leurs entrées.
Martin Berger
1
@ Mark J, je ne comprends pas ce que vous dites. L'approche interactive dit simplement qu'un appareil est calculable s'il réagit de manière mécanique à ses entrées, en utilisant des ressources finies. Oui, si l'autre partie de l'interaction fait quelque chose de fou, comme entrer l'Oméga de Chaitin, le dispositif mécanique peut faire quelque chose de fou, comme calculer le problème stoppant. Et alors?
Martin Berger
1
À mon avis, le TCT ne concerne pas ce qui est physiquement réalisable. Au lieu de cela, c'est un test grossier qui exclut certaines choses clairement non implémentables: si le CTT dit que quelque chose n'est pas calculable, alors ce n'est pas physiquement implémentable, mais je ne pense pas que l'implication inverse soit valable.
Martin Berger
1
@ Mark J, l'exigence "un dispositif est calculable s'il réagit de manière mécanique à ses entrées, en utilisant des ressources finies" ne nécessite pas que les entrées soient générées de manière mécanique. Il est certain que la saisie d’Oméga de Chaitin ne peut pas être générée mécaniquement.
Martin Berger
-8

En parcourant le papier de Wegner, il est clair qu'il est un peu mélodramatique et contrariant, mais il a un point. L’avenir de l’informatique est sans doute beaucoup plus centré sur la robotique , l’ IA ou l’ analyse de données (de vastes «big data» dans le monde réel) qu’il ne semble pas mentionner beaucoup par son nom, mais qu’il fait clairement allusion à son modèle. et ces domaines sont très largement centrés sur l'univers en dehors des entrées et des sorties d'un TM.

historiquement, elle s'appelait également cybernétique, telle qu'elle a été inventée / formulée par Weiner. le point essentiel de la robotique est que les entrées et les sorties ne sont pas simplement numériques et sans signification, ce que l’on pourrait conclure en regardant une MT; ils le sont, mais ils ont des implications / effets / causes réels, etc., et la machine forme une boucle de rétroaction avec l'environnement.

Je dirais donc que les MT et la robotique forment pour ainsi dire une relation de synergie ou de symbiose très naturelle. mais ce n’est pas une affirmation radicale et c’est ce que Wegner annonce avec beaucoup de fanfare, en termes différents, peu controversé ou novateur. En d'autres termes, Wegner semble s'ériger intentionnellement comme un iconoclaste intellectuel ou académique dans son style ... et quelle est donc la communauté du SDC qui lui refuserait cet encadrement mélodramatique? néanmoins voir [2] pour une réfutation sérieuse.

L’exemple de Wegner en matière de conduite d’une voiture est très pertinent et d’autres percées récentes dans le TCS peuvent être citées:

  • le défi de la course sur route DARPA et la proximité de Google sur la technologie d'une voiture au volant. [3]
  • le cas de la victoire d'échecs de Big Blue AI sur Kasparov
  • la récente victoire du Deep Blue Jeopardy Challenge
  • le rover mart de plus en plus autonome
  • une percée annoncée récemment dans la reconnaissance d'objet non supervisé par Google. [4]
  • reconnaissance vocale commercialisée

mais il est vrai que ce qui a commencé il y a quelques décennies comme une simple théorie avec les MT est maintenant un phénomène du monde réel et que des segments de la communauté de la tour d'ivoire pourraient être en quelque sorte opposés à la réalité, voire même à la négation, et à la fondamentale [près de Kuhnian ] transformation et décalage "actuellement en jeu". ceci est quelque peu ironique parce que Turing a été très appliqué dans beaucoup de ses perspectives et études telles que son intérêt pour un test opérationnel de l'IA (le test de Turing), la dynamique chimique, le calcul de résolution des échecs, etc. [5].

vous pouvez même voir cela dans un microcosme sur ce site en discutant de la façon de définir la portée et d'arguments chauffés pour savoir si une balise apparemment inoffensive, appelée application de la théorie, est légitime. [7]

et notons que TCS étudie en fait de nombreux modèles de calcul interactifs et que de nombreuses recherches clés sont en cours dans ce domaine ... en particulier des systèmes de preuve interactifs permettant de définir toutes les classes de calcul importantes [6].

[1] Thèse Church-Turing: briser le mythe de Goldin & Wegner

[2] Y a-t-il de nouveaux modèles de calcul? une réponse à Goldin & Wegner de Cockshott & Michaelson

[3] Googles auto-conduite voitures - 300K miles enregistrés, pas un seul accident sous contrôle informatique, l'Atlantique

[4] Reconnaissance par Google d'objets non supervisés d'images Youtube

[5] Contributions d'Alan Turings à CS

[6] Paysage des systèmes de preuve interactifs

[7] Sur la modification de notre portée - une proposition

vzn
la source
9
Ce qui a commencé il y a quelques décennies comme une simple théorie avec les MT est maintenant un phénomène très réel - Bien sûr, nous le savons. Nous l'appelons "informatique".
Jeffε
Une analogie qui était à la limite de mes pensées en écrivant ceci, mais qui a finalement été éclaircie plus tard: pensez que la distinction entre biologie in vivo et in vitro est pertinente. le TM est analogue à ce dernier. les autres modèles (émergents) sont analogues aux premiers. =)
vzn
de toute façon, le volume 2006 montre de nombreux informaticiens prestigieux qui sont d’accord avec le nouveau paradigme. notez également le dernier essai de la collection: Lynn Stein, Interaction, calcul et éducation - Cet ouvrage décrit dans son ensemble un changement fondamental dans la culture de l’informatique, qui est passé de la résolution de problèmes algorithmiques à une perspective dans laquelle l’interaction joue un rôle central. . Dans ce chapitre, Stein souligne que ce changement doit s’accompagner d’un changement correspondant dans l’enseignement de l’informatique, dans le «récit» fondamental que nous racontons à nos étudiants dans leurs cours d’introduction.
vzn
4
@vzn Argument de l'autorité
Martin Berger