Pourquoi utilisons-nous le jeu de portes standard que nous utilisons?

14

L'ensemble de portes typiquement utilisé pour le calcul quantique est composé des qubits simples de Cliffords (Paulis, H et S) et des contrôlés-NON et / ou contrôlés-Z.

Pour aller au-delà de Clifford, nous aimons avoir des rotations complètes de qubit unique. Mais si nous sommes minimaux, nous optons simplement pour T (la quatrième racine de Z).

Cette forme particulière de l'ensemble de portes apparaît tout. Comme l'expérience quantique p d'IBM, par exemple.

Pourquoi ces portes, exactement? Par exemple, H fait le travail de mappage entre X et Z. S fait de même le travail de mappage entre Y et X, mais un facteur de 1 également introduit. Pourquoi n'utilisons-nous pas une unité de type Hadamard (X+Y)/2 au lieu de S? Ou pourquoi n'utilisons-nous pas la racine carrée de Y au lieu de H? Ce serait mathématiquement équivalent, bien sûr, mais cela semblerait un peu plus cohérent en tant que convention.

Et pourquoi notre porte non Clifford est la quatrième racine de Z? Pourquoi pas la quatrième racine de X ou Y?

Quelles conventions historiques ont conduit à ce choix particulier de porte?

James Wootton
la source
1
La réponse serait-elle le théorème de Gottesman-Knill? Tenez-vous avec des portes qui permettent une simulation efficace d'un circuit quantique sur un ordinateur classique?
Andrew O
@AndrewO Je suppose que Gottesman-Knill expliquerait le fort biais de Clifford. Mais je ne comprends toujours pas pourquoi notre ensemble standard de portes sont celles qu'elles sont, plutôt que d'autres choix apparents plus symétriques.
James Wootton

Réponses:

12

Quiconque a écrit un article et s'est demandé s'il pouvait améliorer la notation, ou présenter l'analyse un peu différemment pour la rendre plus élégante, sait que les choix de notation, de description et d'analyse peuvent être un accident - choisi sans motivations profondes. Il n'y a rien de mal à cela, cela n'a tout simplement pas de justification solide pour être d'une manière particulière. Dans les grandes communautés de personnes plus soucieuses (peut-être avec raison) de faire avancer les choses plutôt que de présenter l'image la plus propre possible, cela va se produire tout le temps.

Je pense que la réponse ultime à cette question va être dans ce sens: c'est surtout un accident historique. Je doute qu'il y ait des raisons profondément réfléchies pour que les portails soient tels qu'ils sont, pas plus qu'il n'y a de raisons profondément considérées pour lesquelles nous parlons de l'état de Bell un peu plus souvent que l'État| Ψ-=(|01-|10) /|Φ+=(|00+|11)/2 .|Ψ=(|01|10)/2

Mais nous pouvons toujours considérer comment l'accident est survenu et s'il y a quelque chose que nous pouvons apprendre sur les façons de penser systématiques qui auraient pu nous y conduire. Je m'attends à ce que les raisons viennent finalement des priorités culturelles des informaticiens, les biais profonds et superficiels jouant un rôle dans la façon dont nous décrivons les choses.

Une digression sur les états de Bell

Si vous me supportez, j'aimerais m'attarder sur l'exemple des deux états de Bell et | Ψ - comme un exemple indicatif de la façon dont une convention arbitraire finalement peut venir par accident, en partie à cause des préjugés qui n'ont pas de racines profondes mathématiques.|Φ+|Ψ

Une raison évidente pour préférer sur | Ψ - est que le premier est plus évidemment symétrique. Comme nous ajoutons les deux composants pour | Φ + , il n'est pas clairement nécessaire de défendre pourquoi nous l'écrivons comme nous le faisons. En revanche, nous pourrions tout aussi bien définir | Ψ -= ( | 10 - | 01 ) /|Φ+|Ψ|Φ+ avec le signe opposé, qui n'est ni meilleur ni pire motivé que le choix| Ψ-=(|01-|10) /|Ψ=(|10|01)/2 . Cela donne l'impression que nous faisons des choix plus arbitraires lors de la définition| Ψ-.|Ψ=(|01|10)/2|Ψ

Même le choix de la base est quelque peu flexible dans le cas de : on peut écrire | Φ +: = ( | + + + | - - ) /|Φ+ et obtenir le même état. Mais les choses commencent à empirer un peu si vous commencez à considérer les états propres| ±i:=(|0±i|1) /|Φ+:=(|+++|)/2 de l'opérateurY: on a| Φ+=(|+i|-i+|-i|+i) /|±i:=(|0±i|1)/2Y . Cela semble toujours assez symétrique, mais il devient clair que notre choix de base joue un rôle non trivial dans la façon dont nous définissons| Φ+.|Φ+=(|+i|i+|i|+i)/2|Φ+

Etre les dindons de la farce. La raison pour laquelle semble "plus symétrique" que | Ψ - est parce que | Ψ - est littéralement le moins symétrique état à deux qubits, et cela rend plus motivé que | Φ + au lieu de moins motivé. Le | Ψ - état est l'unique de antisymétrique état: état unique qui est le - 1|Φ+|Ψ|Ψ|Φ+|Ψ1 vecteur propre de l'opération SWAP, et donc impliqué dans le test SWAP contrôlé pour la distinction de l'état qubit, entre autres.

  • Nous pouvons décrire jusqu'à une phase globale que ( | a | a - | a | a ) /|Ψ pour littéralement tout état à qubit unique| aetétat orthogonal| a,signifie que les propriétés quirendent intéressant sont indépendants du choix debase.(|α|α|α|α)/2|α|α
  • Même la phase globale que vous utilisez pour écrire l'état ne modifie pas la définition de | Ψ - jusqu'à plus d'une phase globale. La même chose n'est pas vraie de | Φ + : comme exercice pour le lecteur, si | 1 = i | 1 , quel est ( | 00 + | 1 ' 1 ') /|α|Ψ|Φ+|1=i|1 ?(|00+|11)/2

Pendant ce temps, n'est qu'un état au maximum enchevêtré dans le sous-espace symétrique tridimensionnel sur deux qubits - le sous-espace de + 1 vecteurs propres de l'opération SWAP - et n'est donc pas plus distingué en principe que, disons, | Φ -a | 00 - | 11 .|Φ++1|Φ|00|11

Après avoir appris une chose ou deux sur les états de Bell, il devient clair que notre intérêt pour en particulier n'est motivé que par une symétrie superficielle de la notation, et non par des propriétés mathématiques vraiment significatives. C'est certainement un choix plus arbitraire que | Ψ - . La seule motivation évidente pour préférer | Φ + sont des raisons sociologiques liées à l'évitement des signes négatifs et des unités imaginaires. Et la seule raison justifiable à laquelle je puisse penser est d'ordre culturel: en particulier, pour mieux accueillir les étudiants ou les informaticiens.|Φ+|Ψ|Φ+

Qui a commandé CNOT?

Vous demandez pourquoi nous ne parlons pas plus de . Pour moi, la question la plus intéressante que vous posez également: nous parlons-nous tellement deH=(X+Z) /(X+Y)/2 , lorsqueH=(X+Z)/2 fait plusieurs des mêmes choses? J'ai vu des exposés donnés par des physiciens optiques expérimentaux à des étudiants, qui décrivent même la performanceY sur un état de base standardcommeeffectuant une porte Hadamard: mais c'était unYPorte Y qui était en fait plus naturelle pour lui. L'opérateurY est aussi plus directement lié aux opérateurs Pauli, évidemment. Un physicien sérieux pourrait considérer comme curieux que nous nous attardions autant sur le Hadamard.Y

Mais il y a un plus grand éléphant dans la pièce - quand nous parlons de CNOT, pourquoi parlons-nous de CNOT, au lieu d'une autre porte d'enchevêtrement qui est symétrique sur ses facteurs tenseurs, ou mieux encore U = exp ( - i π ( Z Z ) / 2 )CZ=diag(+1,+1,+1,1)U=exp(iπ(ZZ)/2)qui est plus étroitement lié à la dynamique naturelle de nombreux systèmes physiques? Sans parler d'unitaire tel que ou d'autres variantes de ce type.U=exp(iπ(XX)/2)

La raison, bien sûr, est que nous nous intéressons explicitement au calcul plutôt qu'à la physique en soi. Nous nous soucions de CNOT parce qu'il transforme la base standard (une base qui est préférée non pas pour des raisons mathématiques ou physiques, mais pour des raisons centrées sur l' homme ). La porte ci - dessus est un peu mystérieuse du point d'un informaticien: il est pas évident sur la surface de ce qu'il est pour , et pire encore, il est plein de coefficients complexes Icky. Et la porte U ' est encore pire. En revanche, CNOT est un opérateur de permutation, plein de 1 et de 0, permutant la base standard d'une manière qui est évidemment pertinente pour l'informaticien.UU

Bien que je m'amuse un peu ici, au final, c'est pour cela que nous étudions le calcul quantique . Le physicien peut avoir des connaissances plus approfondies sur l'écologie des opérations élémentaires, mais ce qui importe à l'informaticien à la fin de la journée, c'est comment les choses primitives peuvent être composées en procédures compréhensibles impliquant des données classiques. Et cela signifie ne pas trop se soucier de la symétrie aux niveaux logiques inférieurs, tant qu'ils peuvent obtenir ce qu'ils veulent de ces niveaux inférieurs.

Nous parlons de CNOT parce que c'est la porte à laquelle nous voulons passer du temps à réfléchir. D'un point de vue physique, les portes telles que et U ' comme ci-dessus sont dans de nombreux cas les opérations auxquelles nous penserions pour réaliser CNOT, mais le CNOT est la chose qui nous intéresse.UU

Des raisons profondes, et pas si profondes, de préférer la porte Hadamard

Je m'attends à ce que les priorités des informaticiens motivent beaucoup de nos conventions, par exemple pourquoi nous parlons de , au lieu de(X+Z)/2 .Y(1iY)/2

H

|0,|1 and 'the' conjugate basis |+,| (that is to say, the eigenbasis of the X operator, as opposed to the Y operator) — the so-called 'bit' and the 'phase' bases, which are two conjugate bases that you can express using only real coefficients. Of course, Y also transforms between these bases, but also introduces a non-trivial transformation if you perform it twice. If you want to think of "toggling between two different bases in which you might store information", the Hadamard gate is better. But — this can only be defensible if you think it is important specifically to have

  • a gate H transforming between the standard basis and the very specific basis of |+,|;
  • if you care specifically about H having order 2.

You might protest and say that it is very natural to consider toggling between the 'bit' and 'phase' bases. But where did we get this notion of two specific bases for 'bit' and 'phase', anyway? The only reason why we single out |+,| as 'the' phase basis, as opposed for instance to |+i,|i, is because it can be expressed with only real coefficients in the standard basis. As for preferring an operator with order 2, to mesh with the notion of toggling, this seems to indicate a particular preference for considering things by 'flips' rather than reversible changes of basis. These priorities smack of the interests of computer science.

Unlike the case between |Φ+ versus |Ψ, the computer scientist does have one really good high-level argument for preferring H over Y: the Hadamard gate is the unitary representation of the boolean Fourier transform (that is, it is the quantum Fourier transform on qubits). This is not very important from a physical perspective, but it is very helpful from a computational perspective, and a very large fraction of theoretical results in quantum computation and communication ultimately rest on this observation. But the boolean Fourier transform already bakes in the asymmetries of computer science, in pre-supposing the importance of the standard basis and in using only real coefficients: an operator such as (X+Y)/2 would never be considered on these grounds.

Diagonal argument

If you're a computer scientist, once you have Hadamard and CNOT, all that's left is to get those pesky complex phases sorted as an afterthought. These phases are extremely important, of course. But just the way we talk about relative phases reveals a discomfort with the idea. Even describing the standard basis as the 'bit' basis, for storing information, puts a strong emphasis that whatever 'phase' is, it's not the usual way that you would consider storing information. Phases of all sorts are something to be dealt with after the 'real' business of dealing with magnitudes of amplitudes; after confronting the fact that one can store information in more than one basis. We barely talk at all about even purely imaginary relative phases if we can help it.

One can cope with relative phases pretty easily using diagonal operators. These have the advantage of being sparse (with respect to the standard basis...) and of only affecting the relative phase, which is after all the detail which we're trying to address at this stage. Hence TZ4. And once you've done that, why do more? Sure, we could as easily consider arbitrary X rotations (and because of Euler decomposition, we do play some lip-service to these operations) and arbitrary Y rotations, which would motivate X4 and Y4. But these don't actually add anything of interest for the computer scientist, who considers the job done already.

And not a moment too soon — because computer scientists don't really care about precisely what the primitive operations being used are as soon as they can justify move on to something higher-level.

Summary

I don't think there is likely to be any very interesting physically-motivated reason why we use a particular gate-set. But it is certainly possible to explore the psychologically-motivated reasons why we do. The above is a speculation in this direction, informed by long experience.

Niel de Beaudrap
la source
It seems you are arguing for two things, namely 1) the convention is an 'accident' and 2) the convention is useful for applications in CS. I'm not sure whether you indeed claim both and how this relates to eachother. Perhaps you can high-light this in your summary.
Discrete lizard
4
@Discretelizard: I am claiming something a bit subtler: the convention is an accident, because the computer scientist is more concerned with expediency for other purposes than with mathematical symmetry. The physicist and the mathematician both care about symmetries more than the computer scientist does, so what we've ended up with something that looks a little arbitrary. The specific arbitrary thing we've ended up with was itself steered by biases from computer science, but superficial biases rather than meaningful ones.
Niel de Beaudrap
7
Indeed, before the arrival of computer scientists, the physicists' preferred maximally entangled state was the singlet state, a.k.a. |Ψ. See e.g. all the 20th century papers about Bell's inequalities.
Frédéric Grosshans