Abstract
In this paper, we are interested in the following problem: find a curve $f$ minimizing the quantity $\mathbb{E}[\min_{t\in[0,1]}\|X-f(t)\|^{2}]$, where $X$ is a random variable, under a length constraint. This question is known in the probability and statistical learning context as length-constrained principal curves optimization, as introduced in (IEEE Trans. Pattern Anal. Mach. Intell. 22 (2000) 281–297), and it also corresponds to a version of the “average-distance problem” studied in the calculus of variation and shape optimization community (Ann. Sc. Norm. Super. Pisa Cl. Sci. II (4) (2003) 631–678; Progr. Nonlinear Differential Equations Appl. 51 (2002) 41–65).
We investigate the theoretical properties satisfied by a principal curve $f:[0,1]\to\mathbb{R}^{d}$ with length at most $L$, associated to a probability distribution with second-order moment. We suppose that the probability distribution is not supported on the image of a curve with length $L$. Studying open as well as closed optimal curves, we show that they have finite curvature. We also derive an Euler–Lagrange equation. This equation is then used to show that a length-constrained principal curve in two dimensions has no multiple point. Finally, some examples of optimal curves are presented.
Dans cet article, nous nous intéressons au problème suivant : étant donné une variable aléatoire $X$, trouver une courbe $f$ minimisant la quantité $\mathbb{E}[\min_{t\in[0,1]}\|X-f(t)\|^{2}]$, sous contrainte de longueur. Dans le contexte des probabilités et de l’apprentissage statistique, cette question est connue sous le nom d’optimisation de courbes principales avec contrainte de longueur, selon la définition introduite dans (IEEE Trans. Pattern Anal. Mach. Intell. 22 (2000) 281–297) ; elle correspond également à une version du « problème de distance moyenne » étudié dans la communauté de calcul des variations et d’optimisation de formes (Ann. Sc. Norm. Super. Pisa Cl. Sci. II (4) (2003) 631–678 ; Progr. Nonlinear Differential Equations Appl. 51 (2002) 41–65).
Nous étudions les propriétés théoriques vérifiées par une courbe principale $f:[0,1]\to\mathbb{R}^{d}$ de longueur au plus $L$, associée à une loi de probabilité ayant un moment d’ordre deux. Nous faisons l’hypothèse que la loi de probabilité n’est pas à support dans l’image d’une courbe de longueur $L$. Etudiant des courbes optimales ouvertes ou fermées, nous montrons qu’elles ont une courbure finie. Nous obtenons également une équation d’Euler–Lagrange. Cette équation est ensuite utilisée pour montrer qu’une courbe principale de longueur contrainte en dimension deux n’a pas de point multiple. Enfin, nous présentons quelques exemples de courbes optimales.
Citation
Sylvain Delattre. Aurélie Fischer. "On principal curves with a length constraint." Ann. Inst. H. Poincaré Probab. Statist. 56 (3) 2108 - 2140, August 2020. https://doi.org/10.1214/19-AIHP1030
Information