Problème de copier-coller

Bonjour,
Je souhaite importer dans une feuille de calcul les données d’un site : https://paris-granville.net/retards/mensuel/202508
Le site présente ces données sous la forme d’un tableau. A priori, un copier-coller devrait fonctionner. Hélas, non. J’ai testé sans succès les différentes options du collage spécial.
Ce que j’obtiens c’est que les lignes du tableau d’origine sont transformées en une liste de champs : le séparateur de champs est traité comme un crlf au lieu d’un TAB. Et le crlf de fin de ligne est traité comme un double crlf.
Bref, je ne trouve pas la solution.
Merci de votre aide.

hélas, techniquement ce n’est pas un tableau (html) :

ça mériterait un peu de programmation pour transposer 4 lignes sur une seule.

sinon, l’IA n’est pas trop mauvaise pour ça :

Je comprend pas votre solution : je vois que vous êtes parti du code html de la page source. Mais après, le tableau de 2 lignes x 4 colonnes ne contient pas les données de la page source.

c’était seulement pour expliquer le pourquoi du problème.

effectivement j’avais demandé à l’IA sur un échantillon abstrait :expressionless:

idem en collant 4 lignes → https://chat.mistral.ai/chat/9ef93464-44e9-436a-987b-9a387da1e156

Bonjour,
la manip n’est pas directe et passe par une application intermédiaire https://tabula.technology/ qui permet de convertir des tableaux PDF en données textuelles.

  1. imprimer la page vers un fichier PDF
  2. extraire les données avec tabula
  3. exporter les données au format CSV

Extrait du fichier .csv obtenu

Train,Jour,Retard,Cause
3451,29,5min,Défaillance de matériel

Effectivement, c’est un peu laborieux, mais ça marche.
Merci.

Bonjour,

Comme chez moi (Ubuntu 22.04) Tabula ne se lance pas, j’ai cherché une autre solution.
Dans une feuille vierge : menu Feuilles > Liens externes > insérer l’url de la page web dans le champ url > appuyer sur la touche Entrée > attendre un peu > Choisir Automatique ou Français dans le dialogue qui apparaît.
Vous avez alors une liste de tables disponibles dans la page web. Choisissez HTML_all et validez. Vous obtenez votre tableau dans la 1ère colonne.

Ensuite si vous voulez séparer les colonnes, il faut alors jouer avec les fonctions de manipulation des chaines de caractères. Par exemple combiner TEXTE.AVANT() et TEXTE.APRES().
Si vous avez "3451 29 5min Défaillance de matériel " dans la cellule A4, vous pouvez décomposer en 4 champs de la façon suivante :
=TEXTE.AVANT(A4;" ";1;1; ) pour extraire le 1er mot soit “3451”
=TEXTE.APRES(TEXTE.AVANT(A4;" ";2;1);" ";1;1) pour extraire le 2e mot, en extrayant d’abord les 2 premiers puis le 2e de la sous-chaine ainsi obtenue.
=TEXTE.APRES(TEXTE.AVANT(A4;" ";3;1);" ";2;1) pour extraire le 3e mot, en extrayant d’abord les 3 premiers puis le 3e de la sous-chaine ainsi obtenue.
=TEXTE.APRES(A4;" ";3;1) pour récupérer ce qui vient après les 3 premiers mots.
On peut certainement faire autrement, mais c’est la méthode que je comprends le mieux. :wink:

En procédant ainsi on perd l’hyperlien, mais on peut facilement le reconstruire avec la fonction LIEN.HYPERTEXTE().

L’importation du tableau produit des lignes vides. Pour les supprimer, il suffit de mettre un auto-filtre, de filtrer les lignes vides et copier-coller le résultat dans une autre feuille.

Tout fonctionne jusque là : dans une feuille vierge : menu Feuilles > Liens externes > insérer l’url de la page web dans le champ url >
Mais [OK] demeure en grisé. Alors, impossible d’aller plus loin.

En fait il faut appuyer sur la touche Entrée après avoir insérer l’url. J’ai corrigé mon post.

Liens externes

Deux formules suffiraient également.

ask_126049.ods (17,4 KB)

Merci pour l’information :slight_smile: Personnellement j’ai toujours eu du mal avec les expressions régulières.
Néanmoins attention : selon l’aide, la fonction REGEX() ne fait pas partie de la norme ODF 1.3. Donc prudence s’il faut utiliser le fichier ods avec un autre logiciel ou l’exporter dans un autre format.

Fonction CHERCHE

on peut aussi s’insiprer de Recopie de cellules par incrément de 10

mais on voit que les causes vides créent un décalage :cry: