Le système formel comme graphe orienté
Un système axiomatique formel définit un graphe orienté:
- Sommets: toutes les formules bien formées constructibles à partir des symboles du système
- Arêtes: étapes d'inférence — une formule découle d'autres par une règle d'inférence
- Axiomes: sommets sources distingués sans arêtes entrantes
- Théorèmes: tous les sommets accessibles à partir de l'ensemble des axiomes
Une preuve du théorème T: un chemin orienté depuis l'ensemble des axiomes vers T. La preuve est une séquence de sommets A₁, A₂, ..., Aₙ = T où chaque étape découle d'une règle d'inférence.
Deux propriétés fondamentales d'un système formel, exprimées géométriquement:
Cohérence: aucune formule F et sa négation ¬F ne sont toutes deux accessibles à partir des axiomes. Géométriquement: le sommet théorème F et le sommet théorème ¬F ne sont pas tous deux accessibles. Aucun chemin d'«explosion» n'existe.
Complétude: chaque formule F ou ¬F est un théorème (accessible). Géométriquement: le graphe est fortement connecté en ce sens que pour chaque sommet F, au moins un de F ou ¬F a un chemin depuis les axiomes.
L'incomplétude de Gödel comme propriété géométrique
Kurt Gödel a prouvé en 1931 que tout système formel cohérent assez puissant pour exprimer l'arithmétique de base est incomplet: il existe des formules G telles que ni G ni ¬G ne sont prouvables.
Géométriquement: dans tout système formel cohérent suffisamment riche, il y a des sommets dans le graphe de formules qui ne sont pas accessibles à partir des axiomes — ni le sommet G ni le sommet ¬G n'ont un chemin depuis l'ensemble des axiomes.
La construction de Gödel: il a encodé une formule G qui dit, en essence, «Je ne suis pas prouvable.» Si G était prouvable, le système serait incohérent (une affirmation vraie dit qu'elle n'est pas prouvable). Si ¬G était prouvable, le système serait incohérent (G serait faux mais le système le prouve). Donc ni G ni ¬G n'est prouvable — G est un sommet inaccessible dans un système cohérent.
L'incomplétude n'est pas un défaut des axiomes choisis: Gödel a montré que c'est une propriété structurelle de tout système cohérent assez expressif pour traiter l'arithmétique. Les sommets inaccessibles ne peuvent pas être supprimés en ajoutant plus d'axiomes sans en générer de nouveaux.
Les objets mathématiques comme points dans un espace
La vue platonique des mathématiques peut être formalisée géométriquement: les objets mathématiques habitent un espace abstrait dont les points sont les objets eux-mêmes & dont la structure est donnée par les relations entre eux.
Considérez les nombres naturels ℕ = {0, 1, 2, 3, ...}. La relation de divisibilité définit un ordre partiel: m divise n ssi m | n. Cet ordre partiel définit une géométrie — le diagramme de Hasse du treillis de divisibilité.
Chaque nombre premier occupe une position minimale au-dessus de 1. Chaque nombre composé se situe au-dessus de ses facteurs premiers. La structure de cet espace encode toute la théorie des nombres.
Ce qui rend cela platonique: la structure existe que ou non un esprit l'étudie. Le fait que 7 soit premier — que 7 n'a pas de diviseurs entre 1 et 7 — est un fait sur la position de 7 dans le treillis de divisibilité, indépendamment de la notation, de la culture, ou de la civilisation.
Toute civilisation qui enquête sur le comptage & la divisibilité découvrira la même structure. La géométrie du système de nombres est universelle.
Naviguer dans le treillis de divisibilité
Dans le treillis de divisibilité, le plus petit commun multiple (ppcm) de deux nombres correspond à leur jointure (borne supérieure minimale) & le plus grand commun diviseur (pgcd) correspond à leur infimum (borne inférieure maximale).
Le pgcd peut être calculé via l'algorithme d'Euclide: pgcd(a, b) = pgcd(b, a mod b), se terminant quand b = 0.
Ce que l'abstraction élimine
Abstraction géométrique: projeter un objet de haute dimension sur un sous-espace de dimension inférieure. La projection perd l'information (coordonnées non dans le sous-espace) mais retient parfaitement la structure du sous-espace.
L'abstraction mathématique fonctionne de la même manière. Un groupe est un ensemble avec une opération binaire satisfaisant quatre axiomes. Abstraire vers la structure de groupe élimine: les éléments spécifiques, la règle de calcul de l'opération spécifique, toute structure supplémentaire (ordre, métrique, topologie). Ce qui reste: le squelette des quatre axiomes.
Le gain: chaque théorème sur les groupes s'applique à TOUS les groupes — entiers sous addition, rotations sous composition, permutations sous composition, symétries d'une molécule, groupes de Galois d'équations polynomiales — simultanément. Le théorème abstrait est prouvable une fois; ses instances sont gratuites.
C'est pourquoi les mathématiciens purs résistent à l'ajout d'hypothèses spécifiques au domaine: chaque hypothèse ajoutée restreint l'applicabilité du théorème. Un théorème sur les corps (ajoutant l'inverse multiplicatif) s'applique à moins de structures qu'un théorème sur les anneaux (pas d'inverse multiplicatif requis).
L'arbitrage entre précision & généralité
Il y a un arbitrage: les théorèmes plus abstraits s'appliquent plus largement mais disent moins sur les instances spécifiques. Un théorème sur les espaces vectoriels dit moins sur ℝ^n qu'un théorème spécifiquement sur ℝ^n (où la distance & l'angle sont définis).
La règle implicite de Hamming: abstraire aussi loin que possible tout en retenant les propriétés dont vous avez besoin. Abstraire trop loin & vos théorèmes deviennent vide de sens («tout ensemble avec toute opération satisfait...»). Abstraire trop peu & vos théorèmes échouent à transférer vers de nouvelles applications.