Discussion utilisateur:Verdy p

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.
Aller à : Navigation, rechercher

Archives :


Sommaire

liaison, diacritique double brève souscrit [modifier]

Toute la (longue) discussion (en plusieurs parties) a été transférée dans la sous-page :

Discussion utilisateur:Verdy p/Codage Unicode de la liaison.

Merci de ne pas la continuer ici. verdy_p (d) 13 novembre 2009 à 03:12 (UTC)

Modèle:cel [modifier]

Sur le wiktionary le code Modèle:cel renvoie à Celtic ; est-ce que ça te choque de renvoyer ce modèle vers celte plutôt que langues celtiques ?

regarde la catégorisation de cloche pour comprendre pourquoi je pose la question.

merci

--Diligent 10 décembre 2009 à 09:13 (UTC)

Pas question: le code cel est pour une collection de langues (qui comprend le breton, l'irlandais, la galois, ... et le celte, l'ancienne langue qui a son propre code).
verdy_p (d) 12 janvier 2010 à 19:02 (UTC)

{{transp}} dans le style de {{reli}} [modifier]

Salut,

Je crois que c'est toi qui avait modidié {{reli}} pour permettre une categorisation plus fine comme avec {{reli|fr|rel=chrétienne}} serais-tu favorable a la même modif pour {{transp}} ?? avec par exemple {{transp|fr|trans=maritime}} — Serpicozaure 18 janvier 2010 à 16:55 (UTC)

Non je l'avais juste corrigé pour le normaliser (au niveau du paramètre de langue uniquement, afin que ce ne soit plus le français par défaut, car ça pose des problèmes, et aussi pour mieux le documenter).
  • L'introduction du paramètre "reli=" vient de Szyx, et ne consiste (consistait?) pas à ce qu'il affine la catégorisation, mais à compléter le libellé (la sous-catégorisation thématique en fonction de la religion ne marche pas bien, on tombe dans des sous-catégorisations absurdes pour des religions difficiles à distinguer ou classer, alors qu'on ferait mieux de distinguer clairement le vocabulaire chrétien, juif ou islamique, sans pousser trop loin au delà ce qui est nécessaire à la compréhension des définitions et distinctions de termes et d'emplois, nécessaires à leur bon emplou ou à la bonne traduction).
  • Si tu veux faire en sorte de sous-catégoriser le vocabulaire des transports, la question est de savoir si c'est réellement discriminant (les catégories sont-elles surpeuplées ? La sous-catégorisation permet-elle de distinguer les traductions entre elles?) Personnellement, si des distinctions thématiques sont nécessaires, il me semble que ce devrait être des sous-modèles séparés pour certains domaines particulier (par exemple, au lieu de claser dans les transports, faire un modèle séparé pour l'aéronautique, ou le vocabulaire maritime, ou automobile, ou ferroviaire). Je ne suis pas trop favorables aux paramètres optionnels (et on a déjà des modèles spécialisé par type de transport, dont les catégories thématiques/lexicales sont déjà classées, avec très peu de termes en fait utilisant {{transp}} directement, avec ou sans langue précisée, on est très loin d'avoir des catégories surpeuplés, justement car le domaine des transport est déjà largement sous-catégorisé).
En revanche, le paramètre de langue est standardisé (paramètre 1) et devrait être obligatoire (à défaut de ce paramètre, le modèle devrait catégoriser dans une catégorie "sans langue mentionnée" mais surtout pas utiliser le français (ou une autre langue) par défaut (car ça mélange tout dans des catégories qu'on veut précises). verdy_p (d) 19 janvier 2010 à 13:38 (UTC)

Merci beaucoup pour ton explication détaillée et argumentée, ca va me permettre de categoriser plus justement mes contributions Serpicozaure(discuter) 21 janvier 2010 à 07:43 (UTC)

{{sous-catégoriser par langue/:data}} [modifier]

Peux-tu régler le problème de « {{métadonnées}} en boucle » de ce modèle ? Merci d’avance. Urhixidur 8 avril 2010 à 14:10 (UTC)

paramètres en dehors d'un modèle [modifier]

Il y a quelques pages de conjugaison (abimer, abîmer, y avoir) dans lesquelles tu as inséré des constructions avec {{{}}} pour substituer un paramètre, mais comme ce ne sont pas des modèles, ces paramètres ne peuvent pas prendre des valeurs. Y a-t-il une raison, ou est-ce que je peux les effacer ? Joriki 13 avril 2010 à 12:04 (UTC)

Patrouille [modifier]

Bonjour,

Tu es manifestement un contributeur confirmé et en tant que tel tu n'apprécies pas que ton travail soit détérioré par des vandales.

Globalement tu manifestes un intérêt pour ce projet et sa détérioration te contrarie.

Alors, ce qui suit doit t'intéresser.

Comme tu le sais peut-être, le projet Wiktionnaire est doté maintenant de nouveaux outils à utiliser pour lutter contre le vandalisme.

Tu pourrais aider à la préservation du contenu de Wiktionnaire de façon active ou de façon passive.

Comment ?

En donnant ton accord pour être patrouilleur dans ta page de discussion (une proposition de candidature serait alors ouverte à ton nom) ou en posant ta candidature directement sur la page spéciale. Un vote aurait lieu et comme dans tout vote il ne peut pas être présagé du résultat. Cependant le fait que tu reçoives ce message sur ta page de discussion est un signe très favorable qui doit te permettre de prendre ta décision avec sérénité.

En étant patrouilleur, tu aurais un statut qui ne te donne aucune obligation mais seulement des droits.

Tu serais utile au projet

  • passivement (tes contributions ne seraient pas précédées sur la page de modifications récentes par le signe ! et de ce fait tes contributions ne figureraient pas dans les contributions à contrôler visibles par les autres patrouilleurs)
  • activement, si tu le désirais, en marquant comme contrôlées par rapport au vandalisme les pages de modifications portant des signes !

Sache que tu es totalement libre de ne pas répondre à cette proposition, ni par Oui, ni par Non d’ailleurs. Ce n’est absolument pas une obligation morale et chacun est libre de faire ce qu’il veut.

Pour répondre éventuellement, merci d’ajouter ci-dessous une des mentions suivantes et de signer.

  • Oui, je suis d'accord pour postuler au statut de patrouilleur.
  • Non, je ne suis pas d'accord pour postuler au statut de patrouilleur.

Amicalement.--✍ Béotien lambda 18 juillet 2010 à 05:22 (UTC)

Oui, je suis d'accord pour avoir le statut de patrouilleur. Pourquoi pas, mais ce ne sera pas mon occupation favorite. Je ferai ce que je pourrai de temps en temps. verdy_p (d) 18 juillet 2010 à 05:26 (UTC)
Merci. C'est tout à fait la philosophie du système. Aucune obligation, liberté individuelle. Bon dimanche. --✍ Béotien lambda 18 juillet 2010 à 05:37 (UTC)
Tu as désormais les outils de patrouilleur. --✍ Béotien lambda 17 août 2010 à 09:04 (UTC)

баба [modifier]

Attention, tu as remplacé un modèle donnant un résultat apparemment correct (même si son utilisation était illogique vu son nom) par un modèle n'existant pas. j'annule donc les modifications. Lmaltier 22 juillet 2010 à 20:29 (UTC)

Normal ce n'est pas du tchèque. Le modèle pour le serbe est à créer séparément !!! verdy_p (d)
Tu aurais du voir que j'étais en train de vérifier et classer les déclinaisons tchèques. Et ce mot n'avait rien à faire dans les listes tchèques.
Je viens de copier le modèle tchèque réutilisé à tord pour le serbe (qui au passage mériterait une sérieuse reclassification entre ses versions latine et cyrillique, même en conservant la catégorie mère pour le code "sr" sans précision (dont tous les termes seraient à reclasser de toute façon selon l'écriture, mais qui incluerait les deux catégories latine et cyrillique (codes "sr-Latn" et "sr-Cyrl").
Des regroupements de catégories en tant que sous-catégories s'imposeraient aussi pour mettre le serbe (sr) dans le serbo-croate (sh) avec aussi dedans le croate (hr), ou le bosniaque (bs), sachant que pour de nombreux termes, ce sera ambigu de choisir entre les différents dialectes de la langue.
Et aussi créer les divisions entre serbo-croate latin (sh-Latn, contenant le croate hr qui n'existe qu'en latin, et le bosniaque latin bs-Latn), et serbo-croate cyrillique (sh-Cyrl, contenant le serbe cyrillique sr-Cyrl, et le bosniaque cyrillique bs-Cyrl)
Et enfin trier les mots de toutes ces variétés du serbo-croate selon le lexique national (si possible), et l'écriture utilisée (indispensable).
Sinon c'est un énorme mélange inutilisable. Je pourrai m'en occuper éventuellement plus tard.
verdy_p (d) 22 juillet 2010 à 20:45 (UTC)
Pour le serbo-croate, il ne faut surtout pas retirer les sections existantes : en effet, il existe un wiktionnaire en serbo-croate, en plus de ceux en serbe, en croate, etc. On peut juste rajouter les sections Serbe, etc. manquantes. Pour les sous-catégories, pourquoi pas, mais ça peut avoir des conséquences inattendues, il faut absolument en discuter avant (sur la Wikidémie).
Je ne demande pas de retirer les catégories du serbo-croate, mais que cette langue générique regroupe tous ses dialectes (devenus des « langues » seulement récemment). En revanche la séparation entre latin et cyrillique s'impose dans tous ces dialectes, car les modèles utilisés seront tous différents pour l'orthographe, le tri des catégories lexicales, les modèles de conjugaison ou de déclinaisons et accords, de même que pour les entêtes de langue dans les articles (bien qu'il existe une règle assez simple de transcription entre latin et cyrillique, il connait maintenant de nombreuses exceptions ! verdy_p (d) 22 juillet 2010 à 21:02 (UTC)
Dans tous les cas, il ne faut pas remplacer volontairement quelque chose d'affiché correctement par quelque chose de mal affiché, c'était tout ce que je disais. Lmaltier 22 juillet 2010 à 20:54 (UTC)
J'étais en train de faire le tri, je n'aurais pas laissé cela en plan. verdy_p (d) 22 juillet 2010 à 21:02 (UTC)

Catégorie:Accords à vérifier en tchèque [modifier]

je note ton travail de romain sur les modèles de déclinaisons tchèques.

si tu as besoin d'aide (mise-à-jour des mots utilisant un modèle à rendre désuet, en double, etc.), n'hésites pas à me faire signe.

bravo et merci

--Diligent 23 juillet 2010 à 12:08 (UTC)

En général une fois le ménage fait, je marque les doublons restants avec {{suppr}} et ce sera nettoyé plus tard...
Je note aussi un mélange des emplois: les modèles tchèques utilisés pour le polonais par exemple !
Ou omment se compliquer la vie pour revérifier tout ça !
verdy_p (d) 23 juillet 2010 à 12:10 (UTC)

à tout hasard : j'ai créé Modèle:cs-décl-nom-ma-dur-ch, je note l'argument classé. Dans le doute sur ce que cela signifie, j'attire ton attention. --Diligent 12 août 2010 à 09:36 (UTC)

Le pramètre classé m'a servi à déterminer les usages directs du modèle de base pour former toutes les déclinaisons, au lieu d'un sous-modèle spécifique au paradygme de déclinaison. Cela permet de garder à part les déclinaisons sans paradygme pour l'instant, et permet de vérifier les tableaux de déclinaison (car j'y avais noté des erreurs dans les articles, qu'il a fallu revérifier un par un, ce qui était une tâche ardue). Maintenant les déclinaisons sans paradygme indiquées dans les articles sont réduites à quelques exceptions, tous les autres mots utilisant les modèles spécialisés avec paradygmes, ce qui facilite leur vérification en parcourant la liste des emplois de chacun (en cas d'utilisation seulement du mauvais paradygme pour un mot, ce qui ne nécessite que de changer le nom du modèle spécialisé utilisé dans l'article mais pas de refaire le tableau en entier). Le but étant d'avoir moins d'erreurs dans les articles. verdy_p (d) 13 août 2010 à 08:44 (UTC)
Note: si le paramètre n'est pas passé dans le modèle, tout article qui emploira le modèle sera classé dans Catégorie:Accords à vérifier en tchèque. C'est un paramètre donc destiné à la maintenance (et dans l'immédiat, je préfère ne pas le documenter pour éviter que certains soient tentés de l'utiliser avec le modèle de base dans les articles (si la déclinaison est bien une exception, on n'emploira pas le modèle de base, mais le modèle de déclinaison "-autre" qui passera ce paramètre (et permettra aussi un suivi des emplois). verdy_p (d) 13 août 2010 à 08:48 (UTC)

+ Modèle:cs-décl-nom-mi-dur-ch

je crois comprendre. Merci pour les explications détaillées.

--Diligent 13 août 2010 à 10:26 (UTC)

Je fais un peu de maintenance et de nettoyage. Je ne sais pas si tu as noté, j'ai supprimé un modèle inutile employé dans obvod qui n'est pas neutre mais masculin inanimé. Je ne comprends pas pourquoi tundra, jikra, prohra se retrouvent dans la catégorie. Rien dans l'article ni dans le modèle de déclinaison qui explique cela... hmmm. mystère. Tu as une idée ? --Diligent 15 août 2010 à 11:03 (UTC)

La catégorie a été créée pour permettre de vérifier des appels de modèles non spécialisés. Si on emploie un modèle spécialisé qui ne nécessite pas de vérification, ce modèle doit contenir "classé=oui". Si plus tard on constate que même ce modèle doit être sous-classé et vérifié, on remplacera par "classé={{{classé|}}}" dans ce modèle et on passera à nouveau "classé=oui" dans les modèles sous-classés.
Le but étant de vérifier les utilisations selon le paradygme utilisé, puisque chaque sous-modèle spécialisé gère sa liste d'emplois qui est plus facile à vérifier que la longue liste de mots d'un modèle plus générique.
Bref j'ai ajouté "classé=oui" dans le modèle en '-f-ra', et ces mots ne sons plus marqués comme à vérifier. verdy_p (d) 4 septembre 2010 à 08:35 (UTC)

Mailing list [modifier]

Bonjour Verdy p,

J'ai voulu t'envoyer un mail à l'instant pour te prévenir de la création d'une liste de diffusion pour le Wiktionnaire francophone, mais je n'ai pas pu car tu as désactivé cette option dans ton profil.

Je t'invite à t'y inscrire pour être informé régulièrement des différents événements : https://lists.wikimedia.org/mailman/listinfo/wiktionary-fr

Je te souhaite une agréable soirée -- Quentinv57 22 août 2010 à 16:12 (UTC)

Justement je ne veux pas de mailing list, ni aucun email. Je suis sur Wikipédia assez souvent (c'est ma page principale, mentionnée sur ma page utilisateur sur tous les projets où j'ai une activité) pour y être joignable.
En cas d'urgence, c'est sur ma page Wikipédia qu'il vaut mieux me contacter (car je ne suis pas en parallèle tous les projets, et il peut s'écouler des jours parfois avant que je revinne sur un projet).
Donc pas besoin d'inscrire mon email (j'ai essayé, il y a beaucoup trop d'emails envoyés automatiquement par les différents projets pour des raisons futiles ou mineures). J'ai désactivé cette option tout à fait volontairement sur TOUS les projets Wikimédia (les emails ne peuvent être envoyés personnellement que par les admins pour des raisons administratives (licence, etc...), mais pas des mailing lists ou un robot, ou si quelqu'un écrit ou répond sur ma page perso). verdy_p (d) 4 septembre 2010 à 08:25 (UTC)

Clés de tri [modifier]

Les clés de tri de chromo-lithographe, etc. étaient pleinement justifiées. Il y a deux façons classiques de faire, celle utilisée dans les dictionnaires en général, et celles utilisée par exemple pour les listes de gares ou les choses comme ça. Ici, nous utilisons cette deuxième méthode : nous voulons classer boulanger-pâtissier entre boulanger et boulangerie. Ce choix est justifié par le fait qu'on a énormément de locutions et qu'on les traite dans des pages séparées, contrairement à ce que font la plupart des dictionnaires, faute de place. Lmaltier 11 décembre 2010 à 16:53 (UTC)

Oui mais dans ce cas ce n'est pas une expression, et la fusion existe pour ces mots (qui n'existent pas séparément, puisque l'un d'eux est un préfixe uniquement)... Jusqu'à présent partout on pronait la fusion pour les clés de prfixes, quelqu'chose a du changer dans les clés de tris parce que ce cas n'est pas isolé du tout ! verdy_p (d) 11 décembre 2010 à 16:55 (UTC)

Non, non, rien n'a changé, on fait ça depuis très longtemps, et c'est logique, comme le montre l'exemple que j'ai donné. On laisse les espaces dans les clés de tri, et on remplace les tirets par des espaces. C'est un choix. Lmaltier 11 décembre 2010 à 16:58 (UTC)

Ton exemple est très différent, car on a les mots séparés "boulanger" et "pâtissier".
"chromo-" est un préfixe qui ne s'écrit pas seul, et on veut que "chromo-lithographe" se classe avec "chromolithographe"... Le trait d'union est totalement superflu dans ce mot c'est une variante mineure (et désuète) et même dans ce cas on voudra le placer après le préfixe. verdy_p (d) 11 décembre 2010 à 17:03 (UTC)

C'est vrai qu'ici c'est un préfixe, et que boulanger n'est pas un préfixe. Mais il y a des cas beaucoup moins clairs. Nous nous sommes donné des règles simples et claires, adaptées à nos particularités, et faciles à comprendre pour les lecteurs. Lmaltier 11 décembre 2010 à 17:07 (UTC)

Si tu ne veux pas respecter les règles en vigueur ici, ou les changer unilatéralement, je t'invite à créer ton projet concurrent. Lmaltier 11 décembre 2010 à 17:09 (UTC)
(Par ailleurs Lmaltier refuse d'appliquer les règles habituelles pour les indentations des messages sous MediaWiki... Je sais, c'est hors sujet. Mais quand on parle d'appliquer des règles... --GaAs 11 décembre 2010 à 17:13 (UTC))
Il y a surtout que les règles ont visiblement changé et sont incohérentes alors dans plein d'endroits ! car jusqu'à présent on ignorait les traits d'unions de préfixes, comme mentionné dans la doc ! Tu confonds avec les mots composés, qui ici n'en sont pas ! verdy_p (d) 11 décembre 2010 à 17:20 (UTC)
Je viens de vérifier, et c'est vrai qu'une IP avait unilatéralement modifié la documentation du modèle, ce qui la rendait d'ailleurs complètement incohérente, c'est vrai. Il ne faut pas modifier ce genre de chose sans discussion. On en avait discuté, de ces règles. Lmaltier 11 décembre 2010 à 17:24 (UTC)
Correction : c'était toi qui avait fait cette modification sans discussion. Je ne comprends pas : j'avais clairement vu les adresses IP dans l'historique, et maintenant je vois Verdy p à la place... Non, j'ai compris : j'avais consulté l'historique du modèle clé de tri, et affiché les versions avant l'intervention de l'IP et après. Mais ce qui s'affichait était la page de documentation, une autre page, avec donc un autre historique... Lmaltier 11 décembre 2010 à 17:47 (UTC)
Quoi ? Je ne comprends rien à ce que tu dis là, tout et son contraire ! verdy_p (d) 11 décembre 2010 à 19:39 (UTC)
Bon alors, je résume : tu ne dois pas vouloir imposer de nouvelles règles à tout le monde en changeant discrètement une documentation, sans discussion. Lmaltier 11 décembre 2010 à 19:54 (UTC)
Et puis je ne vois pas pourquoi tu m'agresses, alors que le tri c'est moi qui l'ai mis en place depuis longtemps alors qu'avant il n'y en avait pas du tout et ne fonctionnait qu'avec des clés incohérentes. Comme visiblement tu ne comprend pas le tri multiniveaux, c'est toi qui change les règles. Le tri multiniveau a été compliqué à mettre en place à cause de limites actuelles de MediaWiki (qui n'a pas de support natif de UCA) et que ce modèle prend en charge pratiquement intégralement ; en particulier la gestion des majustcules, que tu n'as pas compris, de même que l'ajout inutile des pronoms verbaux, prises en charge automatiquement dans la clé tertiaire, mais qu'on doit éliminer de la clé passée qui génère les clés secondaires et tertiaires où ces pronoms gênent le tri correct : ces pronoms sont bien des éléments mineurs de tri (donc tertiaire, et donc à éliminer du paramètre) qu'on ne doit pas indiquer pour trier les verbes pronominaux avec le verbe non pronominal correspondant.
Je pense que tu ne connais pas le tri UCA. Certes on ne peut atteindre la perfection UCA avec les fonctions du parseur actuel, mais on s'en approche pratiquement (il le niveau tertiaire actuel est en fait un composite du niveau tertiaire UCA et du dernier niveau quaternaire UCA des différences binaires, mais on ne peut pas faire mieux avec un modèle). Il importe que les clés secondaires et primaires soient toutes deux correctes: la clé primaire n'aura jamais de majuscules (mais elle est générée par le modèle), alors que la clé secondaire prend en compte les différences de casse (qu'il faut donc préserver dans le paramètre).
Et je n'ai rien imposé, cela a été discuté il y a longtemps et ma solution a été approuvée alors (après une phase de tests longue ayant conduit à divers compromis, sur une liste de mots alors encore expérimentale bien avant même que le modèle soit utilisé de façon généralisée), sauf par ceux qui ne l'ont pas comprise ensuite et qui n'ont pas participé, toi par exemple.
Et concernant le trait d'union des préfixes et suffixes, cette règle a été une des premières écrites et très stable (bien avant de stabiliser celle des mots composés, y compris avec l'apostrophe où divers essais ont été faits aussi).
Et je note que tu a supprimé des mises en garde concernant les langues où l'apostrophe a valeur de lettre et non de marque d'élision ; ce n'est pas parce que tu ne la comprends pas (la remarque ne concerne pas les mots français), qu'il faut la supprimer car elle est importante ; ce cas avait aussi été discuté contrairement aux modifs faites ensuite qui ont ignoré ces discussions et tenté de "simplifier" les choses).
En l'occurence c'est toi qui veut changer les règles et pas moi. verdy_p (d) 11 décembre 2010 à 19:58 (UTC)
Tu n'as pas mis en place les clés de tri, tu as inventé des règles très compliquées dont nous n'avions pas besoin, sans discussion, ça, je me rappelle très bien. Ce genre de critères de tri pour obtenir un ordre toujours prévisible est parfois fondamental dans certaines applications, mais pas ici. Que paris soit listé dans une catégorie avant ou après Paris, ça n'a aucune importance en pratique. Nous sommes un wiki, nous devons rester simples et compréhensibles par tous, nous ne sommes pas un logiciel. J'ai simplement remplacé un texte incompréhensible par un texte compréhensible, mais je vais rajouter l'exception où l'apostrophe a valeur de lettre. Lmaltier 11 décembre 2010 à 20:11 (UTC)
Je t'invite à remonter dans mes "Archive1" (début 2008) : déjà tu n'avais pas compris à l'époque à quoi ça servait mais je croyais cette discussion close car j'en avais montré l'utilité. La casse est bien à conserver (si tes robots ignorent encore cette règle, il va falloir la revoir, cela conduit à des tris incohérents dans la Catégorie:français très peuplée et où ces détails font la différence). Ces règles je ne les pas inventées, je me suis approché au plus près du tri UCA (standardisé au plan international) avec le modèle, sinon le modèle n'aurait pas été nécessaire. verdy_p (d) 11 décembre 2010 à 20:14 (UTC)
Même sans être un logiciel, « garder la casse » n'est pas une question de logiciel, c'est très compréhensible et linguistiquement parlant. Si on doit fournir un paramètre c'est uniquement pour filtrer certaines différences que MédiaWiki ne sait pas éliminer lui-même simplement (notamment les accents). Pour le reste on garde les capitales qu'ils sait traiter lui-même par des fonctions parseur.
De toute façon UCA est en cours d'implémentation (quand ce sera fait, il ne sera même plus nécessaire de fournir de paramètre au modèle), et j'ai participé déjà à cette partie du code encore testé pour diverses langues. Le seul intérêt du paramètre c'est uniquement faire ce que MediaWiki ne sait pas faire tout seul.
Et je ne l'ai pas discuté qu'ici mais aussi pour Wikipédia et dans l'édition anglophone et d'autres wikis hors de Wikimedia qui demandent aussi l'approcher au mieux UCA (en attendant d'avoir aussi des clés de tri multiples pour des langues différentes, et même plusieurs tris possibles dans une même catégorie offrant plusieurs tris alternatifs). Ceux qui bénéficieront le plus d'UCA seront les wikis des langues asiatiques (à commencer par le coréen et le japonais, le cas du chinois étant bien plus compliqué, les langues indiennes à la composition complexe, ainsi que l'arabe et l'hébreu pour leurs diacritiques multiniveaux, ou encore le thaï et le lao qui nécessite des inversions documentées par Unicode pour les voyelles combinantes codées en préfixe avant la consonne de base). verdy_p (d) 11 décembre 2010 à 20:22 (UTC)
Qu'est-ce qui est le plus important ? Que paris soit juste après Paris (ou l'inverse) dans une catégorie, ou rester le plus simple possible pour les contributeurs ? Moi aussi, je suis dans l'informatique, mais je sais que nous ne devons pas devenir une application informatique, et à plus forte raison encore, pas devenir une application incompréhensible. Ce sont les contributeurs qui font ce projet, il ne faut pas les décourager.
Est-ce que tu veux dire que tu participes au logiciel MediaWiki ? Si des modifications sont prévues pour que les clés de tri soient automatiques sans qu'on ait à s'en occuper, c'est parfait, puisque ça simplifie pour les contributeurs. Je suppose donc qu'on pourra indiquer dans les pages de catégorie de quelle langue il s'agit pour que le tri soit cohérent. Quelle syntaxe est prévue pour ça ? Lmaltier 11 décembre 2010 à 20:32 (UTC)
La syntaxe n'est pas décidée (dans un premier temps ce sera une fonction parseur destinée à être testée séparément sans mettre à jour le schéma de base de données, et permettant les tests pour différentes langues dans des catégories de test).
Un autre développement concerne le tri dynamique des tableaux (qui a aussi besoin d'un support côté serveur avec AJAX, sinon pris en charge en Javascript côté client de façon compatible).
Mais effectivement on pourra indiquer dans les catégories une liste de critères de tri applicables, en fonction des langues qui y sont contenues. De fait, la clé de tri précisée ne servira que pour les cas non pris en charge par UCA, et ne sera alors qu'une clé "préfixe" destinée surtout à créer des groupes dans la liste affichée, les doublons étant alors admis dans ces préfixes, et gérés au sein de chaque groupe par UCA.
Il devrait faire des exceptions (comme par exemple le renversement "nom, prénom" d'un article nommé "prénom, nom". Le tri sera multiniveau et pourra prendre en compte aussi un suffixe. Ce qu'on précisera dans les articles ne sera alors plus que ce groupe d'exception (la plupart du temps même, ces sous-groupes devraient devenir des sous-catégories).
Parmi les sujets évoqués figure le problème de la "première lettre", notamment pour le chinois, car cela dépend de l'interprétation de ce tri (après une translittération Pinyin par exemple, dans une catégorie chinoise admettant deux tris en pinyin ou par clé/traits !), et cela fixe ce qui est affiché dans les entêtes, mais aussi la consultation à partir d'une position donnée par un préfixe d'index.
Cela demandera une mise à jour du schéma de la base de données, mais globalement la majorité des usages actuel de {{DEFAULTSORTKEY:}} deviendra inutile et pourra être nettoyé des articles (comme aussi des modèles qui l'emploient indirectement).
C'est compliqué et prendra du temps (parmi les difficultés: l'intégration d'ICU ou non selon les versions, et comment assurer la compatibilité sur les plateformes MediaWiki dont le moteur PHP ne supporte pas les extensions natives (dans des librairies partagées, .dll ou .so) : une solution toute en PHP est recherchée (et là aussi j'ai écrit du code ; ce développement n'est d'ailleurs propre à MediaWiki, et est en fait un challenge pour l'internationalisation de PHP en général). verdy_p (d) 11 décembre 2010 à 20:58 (UTC)
Pour les cas comme l'inversion du nom et du prénom, nous ne sommes pas concernés. Nous serions plus intéressés par la possibilité de légèrement paramétrer l'ordre alphabétique pour une langue donnée (comment traiter les tirets dans cette langue, par exemple), mais c'est apparemment prévu.
Donc, tu participes bien au logiciel MediaWiki ? J'étais persuadé que c'étaient des salariés de la fondation qui s'en occupaient, que ce n'était pas un logiciel collaboratif. Comment on fait pour participer ? Lmaltier 11 décembre 2010 à 21:06 (UTC)
Les salaries de la Fondation sont très peu nombreux mais ne s'occupent pas du logiciel lui-même (ou très peu, seulement pour l'organisation et la gestion financière des ressources, commandes, factures à payer), car même les décisions stratégiques se font en comité ouvert (par élection et/ou cooptation). Les contributions au logiciel ne sont d'ailleurs pas ouvertes aux seuls projets Wikimedia, mais à tous les utilisateurs et administrateurs de sites wiki. Ca se discute, certains font des modules, les internationalisaent, et la Fondation n'intervient que pour organiser l'adoption ou non d'un nouveau module sur ses serveurs (après avoir fait des tests, y compris de montée en charge, afin de ne pas planter les sites du jour au lendemain). N'importe qui peut proposer, discuter du logiciel sur son site dédié, via Bugzilla, les IRC et mailing-lists. verdy_p (d) 11 décembre 2010 à 21:39 (UTC)
w:MediaWiki indique :
  • environ 195 développeurs qui ont accès en écriture aux sources officielles[3]. Ce sont les SVN committers, terme venant de la commande commit du programme subversion, qui permet de transmettre les modifications sur le serveur central ;
  • un certain nombre de développeurs d'extensions à MediaWiki, sans privilège sur le dépôt subversion de la Wikimedia Foundation ;
  • un certain nombre d'utilisateurs et testeurs actifs sur bugzilla, déposant bugs et/ou patchs.
Si je comprends bien, on peut développer des extensions de manière totalement libre (et donc prendre dans ces extensions les décisions qu'on veut), mais sans avoir le droit de modifier les sources de MediaWiki.
Oui, mais même si on n'a pas les droits SVN, il y a aussi des repositories indépendants pour certains projets (qui peuvent même recevoir une internationalisation via translatewiki.net qui est aussi indépendant de la Fondation). De temps en temps des extensions jugées stables et utiles peuvent être reproposées pour l"intégration aumoins partielle de certaines de leurs fonctionalités. MediaWiki est un logiciel ouvert et pas destiné uniquement à Wikipédia ou au Wiktionnaire, il y a des tas de sites privés commerciaux qui l'utilisent aussi pour leur documentation ou leurs projets internes ou des bases de données payantes (et pas nécessairement des sites collaboratifs non plus)... Le nombre d'extensions est donc impressionnant (parmi elles on trouve plein d'extensions pour le ecommerce, la publicité, le CRM, l'ERM, l'analyse financière et des tas d'interfaces avec diverses bases de données métier, des logiciels comptables, boursiers, la gestion de catalogues produits et tarifaires, les portefeuilles commerciaux,, l'animation commerciale, des applis scientifiques, et aussi bon nombre de bases de références documentaires et bibliothécaires... UCA est déjà utilisé dans un certain nombre de ces extensions) verdy_p (d) 11 décembre 2010 à 22:10 (UTC)
Et puis, il y a 195 développeurs MediaWiki réels, qui ont le droit de modifier le logiciel (je suppose que c'est après beaucoup de discussions).
De laquelle des deux catégories parlais-tu ? De laquelle fais-tu partie ? Lmaltier 11 décembre 2010 à 21:50 (UTC)
Concernant les tirets, UCA ne prendra pas en charge ce genre d'exception tout seul. Cela s'oriente vers la gestion des règles de tri telles qu'elles sont discutées et standardisées via le projet CLDR (maintenant hébergé par Unicode). Il n'est pas encore prévu de supporter des tailorings plus complexes, sauf si on peut formaliser cela de façon générique pour une locale (par exemple, aux moins deux tris pour l'allemand, le standard allemand, le standard suisse). Gérer des options spécifiques doit pouvoir se préciser dans un identifiant de locale BCP 47 (voire la nouvelle RFC publiée par Unicode ces derniers jours à ce sujet, qui permet de passer des options de tri ; options désormais intégrées au registre IANA).
Il ne semble pas qu'on pourra faire des tailoring dynamiques, mais l'option retenue utilisera une liste de locales supportées avec lesquelles il faudra composer. L'une d'elle sera présente sur tous les wiki (ce sera le tri de la locale "root" de CLDR, uniquement basé sur la table DUCET sans aucun tailoring, qui devrait être le tri par défaut, l'autre sera le tri standard dans la langue par défaut du wiki, mais chaque wiki pourra préciser plusieurs tris pris en charge par défaut dans toutes les catégories sans qu'il soit nécesaire de mettre quoi que ce soit dans les pages de catégories). L'utilisateur aura le choix du tri avec des options affichées dans la catégorie dans un sélecteur et via l'API (paramètres de requêtes URLs) ; la solution devrait tenir compte aussi (sans que l'utilisateur ait besoin de répéter ce choix à chaque catégorie visitée, de sa locale par défaut (donc en plsu du choix de la langue dans son profil, on pourra aussi préciser le tri préféré dans cette langue, parmi ceux supportés). Devrait apparaître une page spéciale destinée à gérer ou lister les tris supportés.
Mais je n'affirme rien, pour l'instant, tout cela reste encore expérimental et il y a beaucoup de chemin à faire (et pour chaque langue supportée actuellement il va falloir affiner les tris proposés, mais on aura au minimum le tri DUCET (CLDR "root") dans toutes les locales (et sans doûte encore le tri binaire UTF-8 pour la compatibilité au moins transitoirement, mais ce ne devrait plus être l'option par défaut).
La mise à jour prendra aussi du temps sur les gros wikis et demandera des ressoruces serveur importantes pendant des jours, et ne se fera sans doute pas sur tous les wikis en même temps, les catégories étant traitées alors une par une avant qu'un nouveau tri y apparaisse ou y soit sélectionnable.
Les filtres de tailoring seront ensuite à affiner et on pourra alors procéder au nettoyage de certains groupes de clés devenus inutiles dans les articles, une fois un tri de base mis en place, puis ajouter de nouvelles locales de tri.
Tant tout ça il y a beaucoup d'idées, tout reste à planifier, je ne sais pas dans quel ordre tout cela apparaîtra ici en pratique, mais du code est déjà proposé. verdy_p (d) 11 décembre 2010 à 22:10 (UTC)
Où peut-on y avoir accès, à ce code ? J'ai vu des propositions sur le site MediaWiki, effectivement, mais c'est tout. Et ça ne parlait pas vraiment des questions concrètes. Lmaltier 11 décembre 2010 à 22:16 (UTC)

Wiktionnaire:Prise de décision/Modèles de codes de langue [modifier]

Bonjour. Puisque tu as créé la structure des modèles de codes de langue sur Wiktionnaire, tu t’intéresseras probablement à participer à Wiktionnaire:Prise de décision/Modèles de codes de langue. — TAKASUGI Shinji (d) 15 avril 2011 à 04:18 (UTC)

Fichier:Fr-wiktionary-7val-com-2.png n'a pas de licence [modifier]

… et sera bientôt supprimée. --GaAs 17 mai 2011 à 21:00 (UTC)

Il y en a une... CC-BY-SA comme indiqué depuis le début. De toute façon cette image je m'en fous c'était uniquement dans le cadre d'une vieille discussion ici, et pas pour un quelconque article. C'était pour illustrer un problème évoqué dans cette discussion de la Wikidémie en décembre 2008. verdy_p (d) 24 mai 2011 à 22:16 (UTC)
Ah oui, pardon (il fallait de bons yeux). Néanmoins je l'ai supprimée, car si vraiment la CC-BY-SA est applicable, autant la mettre sur Commons (mais je ne donne pas cher de sa peau là-bas). Amitiés. Sourire--GaAs 4 août 2011 à 17:33 (UTC)

Annexe:Conjugaison en français/y avoir [modifier]

J'ai annulé tous tes essais sur cette page (sauf l'intro). Ça ne veut pas dire que je les trouvais « stupides », au contraire. Mais il était temps, àmha, que cette page présente au moins un minimum de choses valides. --GaAs 4 août 2011 à 17:39 (UTC)

hétéronyme [modifier]

Bonjour. Pour information : J'ai tenté de résumer les volumineuses notes que tu avais ajouté, mais petit à petit j'ai fini par les supprimer soit qu'elles étaient redondantes, hors-sujet ou "encyclopédiques". Les liens logiques entre les informations m’ont aussi paru confus. En fait, je pense que la précision "non-synonyme" que nous avons rajouté dans les définitions suffit à lever toute ambigüité. Stephane8888 30 mai 2012 à 08:07 (UTC)

Wiktionnaire:Bulletin des patrouilleurs [modifier]

Comme à tous les patrouilleurs, je t’adresse ce message : Wiktionnaire:Bulletin des patrouilleurs existe désormais, et est fait pour toi. Merci de venir y participer, et sutout d’y aider ceux qui posent des questions.Sourire--GaAs 1 juillet 2012 à 17:11 (UTC)

Wiktionnaire:Critères d’acceptabilité des articles [modifier]

Cette page n'est pas la page appropriée pour faire de longs paragraphes sur les codes langues, ce n'est pas du tout son objet (comme son nom l'indique). Lmaltier (discussion) 7 décembre 2012 à 22:22 (UTC)

Modèles avancés [modifier]

Salut,

Tu as créé Modèle:sous-catégoriser par langue et je voulais savoir si tu pouvais résumer son utilité de façon brève ?

Par ailleurs, dans Modèle:BASEPAGENAME/Documentation, il est fait une allusion à un hypothétique modèle SUBPAGENAME. C’est parce qu’il a vocation à être créé ?

Merci d’avance pour ta réponse,

Cordialement, Automatik (discussion) 28 mars 2013 à 00:46 (UTC)

Le modèle a bien existé. C'était une démo à l'apoque pour tenter de formaliser ce que pourraient être les métadonnées, mais aec Wiidata on pourra faire à peu près la même chose (mais pas pour l'instant car cela ne gère pratiquemetn que les liens interwikis dans possiblité d'intégration dans un article).
Initialement cela faisait partie d'une discussion cherchant à voir comment créer plusieurs clés de tris ou d'autres métadonnées par langue dans des catégories spécialisées. Du côté des tris de catégories, il n'y a toujours rien d'avancé de ce côté là dans MediaWiki puisqu'il est toujours incapable de pouvoir stocker plusieurs clés de tri différentes (un problème pour le tri du chinois par exemple, qui n'a aucun sens).
L'idée était de pouvoir indexer une chaine sur plusieurs critères : Radican/traits, traditionnel, Bopomofo, et diverses autres translitérations afin de permettre des recherches dans le wiktionnaire des mots ou caractères chinois, chose toujours impossible (malgré la création de certaines annexes très incomplètes).
Le modèle est resté comme une démo et n'a pas été étendu au delà des quelques pages où cela a été utilisé (je ne sais pas si ces pages de démo utilisent encore ces modèles ; visiblement le manque de courage ou de volonté de se pencher sérieusement sur le problème des recherches en chinois n'a toujours pas été abordé, on doit donc utiliser des moteurs de recherche ou dictionnaires externes, et des méthodes de saisie hasardeuses et trop incomplètes pour pouvoir trouver tout ce qui est dans le wiktionnaire qui ne fonctionne bien qu'avec les alphabets et syllabaires plus réduits...). Et on ne sait toujours pas trier autrement ici que selon les règles franco-françaises, ne serait-ce déjà que l'allemand ou le suédois (ce que permettait pourtant cette démo fonctionnelle). Sur d'autres wikis que ceux de Wikimedia, il existe des extension pour inclure des métadonnées dans les pages, interrogeables pour la génération d'autres pages: ces extensions utilisent une table annexe. Les métadonnées MediaWiki en a quelques unes (les interwikis, les listes de liens entre pages, listes d'images, listes historiques, mais pas de métadonnées avec un schéma défini dans les pages elles-même, avec des clés de sélection et des valeurs d'attribut propre à chaque clé) verdy_p (d) 1 avril 2013 à 17:29 (UTC)
Merci pour ta réponse.
Si le modèle:SUBPAGENAME a bien existé, il n’est pas dans les logs de suppression : [1].
Ce que tu dis es très intéressant et c’est très avancé comme niveau. J’ai d’ailleurs relu plusieurs fois le message avant de comprendre certaines choses. Si tu penses que ces métadonnées représentent un réel avantage pour les projets Wikimedia, peut-être alors faudrait-il pousser les dévs à développer ces extensions. Si tu penses que le développement de Wikidata suffira comme tu l’as laissé entendre au début de ton propos, je l’espère aussi. Si tu penses que la communauté devrait en attendant (car ça risque de prendre un temps le développement de telles fonctionnalités) adopter les modèles que tu as développés, je suis là également pour t’apporter tout mon soutien. Il ne sera pas technique (vu au niveau où tu en es), mais je veux bien faire la pub de tout ce qui peut améliorer les fonctionnalités offertes par ce dictionnaire. Ce serait au cas où tu avais arrêté par manque de compréhension extérieure que je dis ça, ce qui n’est pas forcément le cas, bien évidemment. Si tu n’as pas le temps mais penses que c’est exploitable, n’hésite pas à me donner la marche à suivre. Tu sais mieux que moi ce qu’il faut faire de toute façon.
Merci pour l’explication donc,
Cordialement, Automatik (discussion) 15 avril 2013 à 00:13 (UTC)

syriaque [modifier]

Bonjour,

J’aimerais aussi, si possible, te demander si l’alphabet hébreu est bel et bien utilisé en syriaque. On en a parlé brièvement. Si tu pouvais donner ton avis, ce serait avec plaisir. Voir Modèle:syr-Hebr. Cordialement, Automatik (discussion) 15 avril 2013 à 00:13 (UTC)

Tout à fait. Le syriaque moderne est écrit dans au moins 7 écritures différentes (record mondial inégalé, sauf peut-être par le sanskrit, qui n'est plus une langue vivante mais une langue religieuse, transcrite activement dans une bonne vingtaine d'écritures indiennes, sino-tibéto-burmanes et indonésiennes).
Dont les écritures syriaque (en nette perte de vitesse), hébreu, arabe, grecque, turco-latine, et moins souvent mais également assyro-palestinienne (aussi appelée néo-araméenne mais dérivée de l'araméen impérial et de l'hébreu), arménienne et copte (il y en a eu d'autres encore, comme l'araméen impérial, mais c'est a priori historique). Unicode reconnait qu'il y au moins 7 écriture vivantes de cette langue vivante.
Le syriaque est une des plus anciennes langues du monde (une des langue du Christ, l'autre étant l'araméen impérial, tandis que ses disciples maitrisaient plutôt le grec) encore parlée par une communauté vivante et dans son histoire elle a utilisé des alphabets encore plus anciens que le grec, dont l'écriture cunéiforme et l'écriture phénicienne qui a précédé les écritures hébreu et grecque.
La langue a beaucoup voyagé aussi avec les premiers chrétiens, même si aujourd'hui son aire géographique vivante est très restreinte. On retrouve des textes syriaques en Ethiopie aussi, avec un dialecte syriaque local (d'usage aujourd'hui uniquement religieux) écrit dans le syllabaire éthiopien, mais le plus souvent les anciens textes syriaques ont été transcrits dans d'autres écritures.
Aujourd'hui le syriaque moderne "populaire" est en premier lieu écrit dans l'abjad arabe, et en second dans les abjads syriaque et hébreu sans que l'un l'emporte sur l'autre ; pour les usages religieux on trouve en tête à égalité les abjads syriaque, hébreu et l'alphabet grec ; puis ensuite l'abjad arabe (dans ses deux formes actuelles néo-arabique et ourdou-persane).
L'écriture hébreu est donc aussi importante que l'écriture syriaque pour cette langue (et peut-être plus maintenant étant donné la présence d'Israël dans la région, et du financement des recherches religieuses car le syriaque est aussi une langue native pour la religion juive dont des écrits sacrés de la Torah et des prières sont récitées en syriaque et non en hébreu; mais pour préserver leur indépendance les textes écrits en arabe font aussi l'objet de recherches (il faut dire aussi que l'écriture arabe dérive de l'écriture syriaque, comme aussi l'écriture assyrienne dont est née l'écriture hébreu; la langue hébreue elle-même a été écrite dans l'abjad syriaque avant d'adopter tardivement l'abjad hébreu ; les premières Toraj n'étaient pas écrites en caractères hébreux mais en caractères grecs ou syriaques, et paléo-assyriens, les derniers textes de la Torah étant écrits initialement dans l'alphabet copte, très proche du grec, avant la sortie des juifs d'Egypte...).
Le syriaque est la seule langue commune des 3 religions du Livre, c'est ce qui lui a permis de durer et continuer à être respectées pendant des millénaires malgré tous les conflits et invasions de toutes sortes. N'ayant jamais été une langue de pouvoir, elle n'a jamais suscité de jalousies ou de convoitises ni de bannissement forcé par suite d'une invasion, elle a toujours été langue de minorité. verdy_p (d) 22 avril 2013 à 15:04 (UTC)
Grand merci pour cette explication riches en informations SourireAutomatik (discussion) 22 avril 2013 à 15:36 (UTC)
La langue, l'écriture et la culture syriaque sont une véritable pierre de Rosette de nombreuses langues etécritures du monde présentes et passées, un pont entre les civilisations. D'où leur caractère précieux pour tous les linguistes et paléographes ; les derniers syriaques natifs en ont conscience. verdy_p (d) 22 avril 2013 à 15:04 (UTC)
Tu parles plus haut « des écritures syriaques » au pluriel, et maintenant au singulier. Comment concilier cela ? (Wikipédia parle aussi d’« écriture syriaque » au singulier) --Automatik (discussion) 22 avril 2013 à 17:22 (UTC)
Non l'ai parlé des écritures différentes utilisées pour écrire la langue syriaque; parmi ces écritures il y a l'écriture syriaque proprement dite.
La langue japonaise utilise simultanément 3 écritures (2 écritures syllabaires, katakana et hiragana, et l'écriture sinographique), et éventuellement une quatrième (latine). La langue coréenne utilise simultanément 2 écritures (l'écriture alphabétique hangûl, et l'écriture sinographique) et éventuellement une troisième (latine). La langue chinoise utilise essentiellement une écriture (sinographique, en fait dans un des 2 styles modernes distincts) et éventuellement 2 autres (latine ou syllabaire bopomofo)... La langue française n'utilise principalement qu'une écriture (latine).
A toutes ces langues il y a en plus l'écriture spéciale de la langue des signes associée, mais les langues des signes sont considérées comme des langues séparées, pour lesquelles il existe plusieurs écritures. Cependant la langue française utilise bien officiellement deux autres écritures reconnues par un statut officiel (l'écriture braille, pour les aveugles ou malvoyants, et l'écriture sténographique Duployé, reconnue comme une capacité professionnelle avec un examen public). La langue française des signes (langue considérée à part de la langue française orale) va reconnaître bientôt l'écriture des signes du système "SignWriting", en plus de l'alphabet français des signes (qui permet de transcrire en signes la langue française orale, par exemple pour épeler certains mots français; mais l'alphabet des signes est d'usage très secondaire même s'il s'intègre bien à la langue des signes française : une fois un mot épélé en alphabet des signes, les "locuteurs" de langues des signes remplacent ce mot épeler par un "surnom" caractéristique propre à la langue des signes française en obéissant à sa propre syntaxe très différente de la syntaxe de la langue française, et beaucoup plus proche en fait d'une syntaxe de langue chinoise).
Bref ne confond les langues et les écritures (la langue française s'écrit dans l'écriture alphabétique latine, on parle pourtant bien d'un alphabet français, mais d'une écriture latine sans qu'on écrive le français en langue latine) ; j'ai bien fait attention de préciser partout si je parlais de l'écriture ou de la langue mais si rien n'est précisé, il s'agit de la langue, ce qui reste clair dans le contexte, relis donc bien. verdy_p (d) 22 avril 2013 à 18:33 (UTC)
OK, merci pour tes lumières. Automatik (discussion) 22 avril 2013 à 18:46 (UTC)
Pour compliquer le tout, "terminologiquement" parlant : la langue française s'écrit dans l'écriture alphabétique latine, on parle pourtant bien d'un "alphabet français", mais d'une "écriture latine" sans qu'on écrive le français en "langue latine" ; "l'alphabet" français est en fait un sous-ensemble de l'écriture latine nécessaire à l'orthographe française, pas un sous-ensemble de la langue française, mais ce sous-ensemble est aussi muni, en plus, d'une convention de tri propre à la langue française; dans l'expression "alphabet L" employé hors contexte (qui peut être ambiguë dans les langues qui peuvent être communément écrites dans plusieurs écritures, l'expression "alphabet L" seule devant être évitée), il ne s'agit pas de "l'écriture L" mais de l'alphabet extrait "d'une écriture E" (non précisée) utilisée dans la "langue L" et muni de sa convention de tri et de certaines de ses conventions orthographiques complémentaire comme la ponctuation ; pour être exact on devrait aussi parler des "systèmes d'écriture" qui consistent en l'ensemble homogène des écritures utilisées ensembles avec les conventions d'usage complémentaires nécessaires à une langue : une langue n'utilise pas directement une ou plusieurs écritures, mais un ou plusieurs systèmes d'écritures lesquelles contiennent chacun une ou plusieurs écritures indépendantes de la langue, plus certaines conventions orthographiques secondaires propres à la langue pour rendre ces écritures lisibles et non ambiguës; l'association d'une langue à un système d'écriture peut aussi passer par plusieurs orthographes possibles, par exemple en français selon les dates de réformes orthographiques.
Dans le Wiktionnaire on s'arrête en codification à celle des langues et des écritures, on n'entre pas dans le détail des systèmes d'écriture (bien que certains systèmes disposent de leur propre "code d'écriture", comme "Jpan" pour le système d'écriture japonais, tel qu'utilisé pour transcrire la langue japonaise ainsi que quelques autres langues japonaises apparentées, ce système d'écriture étant composé de 3 écritures, codées "Hani"/"Kata"/"Hira", et de conventions pas réellement orthographiques mais tout de même de nature sémantique et lexicale, permettant de définir laquelle des 3 écritures sera utilisée dans ce système, et de partager une ponctuation commune; le "système d'écriture" inclut d'autre part des règles de composition permettant d'ordonner les caractères selon deux conventions différentes pour une présentation horizontale ou verticale, et dans le cas horizontale une présentation tabulaire en "carrés" de composition sinographique, et une autre plus linéaire, non carrée mais comparable à nos alphabets, utilisée pour transcrire uniquement les 2 écritures syllabaires ou l'écriture annexe latine dite "romaji"; le système d'écriture organise aussi la réorientation ou pas des caractères selon les présentations horizontales ou verticales). Le système d'écriture organise aussi les transformations licites du texte (par exemple pour conserver les distinctions de casse lors de la transformation du texte en capitales), ou d'autres styles parfois signifiants comme l'italique et le gras, les indices et exposants pour les abréviations).
Cependant il y a trois exceptions :
  • pour les langues chinoises, il faut parfois préciser dans le Wiktionnaire le système d'écriture (traditionnel, codé "Hant", ou simplifié, codé "Hans") et pas seulement l'écriture (sinographique, codée "Hani") car leur sémantique est alors différente même si les caractères sont codés de façon identiques ou deux caractèers codés différents peuvent partager une présentation identique dans des systèmes d'écriture différents.
  • pour les notations phonologiques ou phonétique, il est parfois nécessaire de codifier que le système d'écriture est l'API (qui a ses propres conventions et n'autorise pas certaines transformations) et non le système d'écriture alphabétique latin (plus libéral en terme de présentation). Le Wiktionnaire n'a pas d'articles nommés ou classés selon la notation phonétique, mais utilise des modèles pour adapter la présentation ; il peut en revanche avoir des lemmes séparés (eux-mêmes non codifiés) au sein du même article, selon la prononciation. On a le même cas pour les autres conventions, telles que les différences de casse contextuelles (on crée des articles nommés sans capitalisation des minuscules à l'initiale d'une phrase), ou les conventions de notation des abréviations avec des exposants (il faut créer des lemmes séparés au sein du même article ci-nécessaire
  • pour les conventions de notation mathématiques ou scientifiques (qui pourraient distinguer l'italique, le gras, ou d'autres styles de présentation qui ne sont normalement pas signifiants dans le système d'écriture alphabétique latin mais signifiant dans le système d'écriture des notations scientifiques), et d'autres conventions informatiques (présentation du texte des langages de programmation, qui cependant sont le plus souvent hors du contexte de la langue; le langage informatique n'est pas une vraie langue distincte, et devrait parfois être représenté plutôt comme un système d'écriture, distinct de l'écriture latine le plus souvent utilisé, certains langages informatiques utilisant des systèmes d'écritures permettant de nombreuses écritures, par exemple Javascript pour avoir des identificateurs signifiants dans une langue donnée, voire aussi traduits comme les noms de fonctions Excel).
On ne codifie pas non plus dans le Wiktionnaire les orthographes, qui font l'objet simplement d'articles de titres ou séparés ou de lemmes supplémentaires au sein des articles si leur orthographe permet de les regrouper facilement (ce qu'on fait aussi dans les dictionnaires papier au moyen de renvois d'un lemme à l'autre, ou en incluant des alternatives orthographiques ou tableaux de termes dérivés, par exemple par mode et temps de conjugaison, cas, genre et nombre).
Compliqué n'est-ce pas ? Il faut toujours être clair mais cela nécessite de connaitre certaines définitions terminologiques pour savoir comment y prêter attention. Sinon j'admet que ce ne sera pas clair pour tout le monde, et plein de gens confondent toutes les notions en ne sachant pas reconnaitre quelq sont les termes importants car distinctifs. :-) verdy_p (d) 22 avril 2013 à 18:33 (UTC)
Pour en revenir à la question de base, je crois que tu mélange[s] syriaque et araméen qui sont deux choses différentes , voir Catégorie:langues aramaïques, les parties de la Bible écrite dans une langue de ce groupe le sont en araméen biblique, pas en syriaque. Dhegiha (discussion) 22 avril 2013 à 19:54 (UTC)
Non, car l'araméen biblique (je parle ici à la fois des langues et leurs écritures) a rapidement disparu et ses héritiers immédiats sont le grec, le syriaque et l'hébreu dès le moment où les évangiles ont été écrites. La vie de Jésus n'a pas été écrite dans les évangiles de son vivant mais par ses héritiers dans d'autres langues et écritures (et très vite repris en écriture syriaque qui a gardé la trace la plus proche de la prononciation de l'araméen du temps de Jésus, cet araméen-là ayant complètement disparu en tant que langue vivante). Les premières transcriptions ont été faites en grec, mais jugées insatisfaisantes, assez vite reprises en syriaque et en hébreu (pas une simple traduction mais un retour aux sources plus proches de la langue araméenne de Jésus). Les coptes ont ensuite fait une démarche similaire à partir de la transcription grecque, et conservé cela dans une adaptation de l'alphabet grec aux langues sémitiques (cela a donné l'alphabet copte).
Toi tu veux parler de l'ancien testament qui n'aborde pas du tout la vie de Jésus puisqu'il est bien antérieur ! Ton expression "araméen biblique" n'a strictement aucun sens, la Bible n'a pas été écrite à une seule période ni en une seule langue, mais par diverses cultures de civilisation différentes. Ce qui a un sens c'est "l'ancien araméen" ou "araméen impérial", ou le "néo-araméen". verdy_p (d) 22 avril 2013 à 20:11 (UTC)
Araméen biblique n’a aucun sens??? [2]. Ca n’a pas empêché deux linguistiques d’en écrire une grammaire (et je ne parle que du français). Dhegiha (discussion) 22 avril 2013 à 21:32 (UTC)
Admettons que c'est un usage mais que l'expression reste ambiguë... La Bible comprenant plusieurs langues d'origines désignées comme "araméen" (au sens de famille de langues) ou des langues de traduction postérieures, parfois réunies dans leur formes modernes aujourd'hui en "macrolangues" quand elles sont assez largement intelligibles entre elles ou lorsqu'il existe parmi elle une lingua franca comprise par les locuteurs des autres langues de la famille (cette lingua franca étant souvent une création plus récente sous forme de "langue chapeau" plus ou moins normalisatrice d'une créolisation de ces langues d'origines, ou tentant de retrouver leur origine commune ou de réguler ce qui les unit les plus, la langue chapeau ayant tendance alors à écraser les anciennes langues distinctes de la famille ou de la macrolangue, pour les réduire à l'état de "dialectes" de la langue chapeau).
Mais il n'y a pas de langue chapeau dans les langues araméennes, elles ont chacune leur particularité selo, les époques et les régions, les migrations de population suite aux diverses invasions, et divers niveaux de créolisation aussi avec les langues des envahisseurs. Même au temps de la Bible, il y avait déjà cette richesse de langues (certainement plus d'ailleurs qu'aujourd'hui, bon nombre des variétés ont disparu, sauf celles conservées par des textes sacrés qui ont été pieusement gardés et son restés dans les langues parlées par un conservatisme fort)
Mais j'insiste: tu sembles réduire la Bible au seul nouveau testament. Pour l'ancien testament l'araméen était déjà présent. Toutefois le contenu de la Bible a aussi évolué par le changement de statut de textes autrefois considérés comme canoniques et qui ne le sont plus : font-ils encore partie de la Bible? Cela dépend des confessions abrahamiques (diverses confessions chrétiennes, catholiques, protestantes ou orthodoxes, et juives; pour les musulmans, les textes sont encore importants mais plus "canoniques", sauf ceux ayant trait aux commandements reçus par Abraham, Ibrahim pour les musulmans, mais dont le texte strictement d'époque a été perdu mais seulement gardé via des traductions les plus anciennes dans d'autres langues sémitiques)
Ne te fie pas au seul titre du livre que tu trouves, c'est insuffisant. Mais si tu consultes la préface, tu verras qu'utiliser le singulier pour désigner la langue araméenne de la Bible est une erreur, ou au mieux une simplification par réduction à sa forme Biblique la plus récente, celle du nouveau testament. LA première chose que fait l'auteur c'est de préciser à quelle époque et quel groupe culturel il consacre principalement son étude, ce qui ne l'empêche pas de mettre des renvois à d'autres formes voisines, plus anciennes, ou plus récentes. verdy_p (d) 22 avril 2013 à 22:07 (UTC)

Catégorie de langues [modifier]

Bonjour Verdy p, tu as commencé à modifier des catégories de langues, défaisant souvent ce que d’autres avaient construit et ce, sans discussion préalable alors que manifestement, cela ne fait pas l’unanimité. Je ne peux que te conseiller d’en discuter avec les intéressés auparavant (auteurs & linguistes tels que Dhegiha, Eölen, etc.). La classification qui avait été entreprise se fonde essentiellement sur des travaux de linguistes en privilégiant les filiations linguistiques. En ce sens, une famille comme "langues nord-amérindiennes" par exemple est contestable et de toute façon d’un piètre intérêt, qu’elle possède un code ISO ou pas. Bref, cela demande pour le moins un éclaircissement de ta part. — Unsui Discuter 23 avril 2013 à 09:03 (UTC)

Je n'ai rien "défait" du tout, je m'appuie totalement et conserve les catégories déjà posées en ajoutant celles qui manquent (et il y en a beaucoup) mais pour l'instant uniquement les groupes ISO 639-5 dans rentrer dans le détail des sous-familles autres que celles qui sont déjà normalisées (je ne vais pas aller au delà et m'appuyer aussi sur ce qui est fait de façon comparable sur le Wiktionnaire et la Wikipédie anglophones). Plein de langues ne sont dans aucune catégories actuellement, me^me pas les principales alors que les catégories existent. Sinon il y a parfois 2 catégories homonymes à un pluriel prêt.
La politique établie étant déjà décidé (et documentée) de s'appuyer sur les normes internationales, je ne crois pas avoir cassé ou trahi quoi que ce soit qui n'ait déjà été discuté. Les familles ISO 639-5 sont pour l'instant la seule base admise actuellement qui aient une norme, les autres familles sont uniquement potentielles.
Et les listes internationales à ce sujet (The Linguist par exemple) ne voient aucun problème à la norme ISO 639-5 actuelle puisque justement elle ne normalise pas ces sous-familles en chantier (et qui resteront en chantier pour longtemps). Je ne juge pas de la pertinence d'un linguiste par rapport à un autre.
Et ce que je fais est en tout point comparable à ce qui est classé aussi dans les autres Wiktionnaires qui utilisent d'abord ISO 639-5 comme bae, même si ces familles sont contestées par certains (parce que ce qui est proposé à la place est aussi contesté et de toute façon objet d'aucune norme).
Il y a des milliers de langues à classer et pour l'instant les normes ISO font encore référence. Quand elles seront mises à jour pas de problème pour aussi en tenir compte (par exemple ISO 639-5 a supprimé une famille depuis sa création, et en a corrigé une à ma demande, car cela entrainait une contradiction avec les autres parties de la norme ISO 639 et une anomalie dans BCP47, mais cela a pris des mois).
Toutes les familles dans ISO 639-5 sont attestées pour leur usage actuel, même si elles ne sont pas idéales car encore trop large. Mais ce sont des bases de travail pourtant indispensables y compris pour les linguistes (il y a déjà plus de 7000 langues codifiées, certaines aussi sont contestées). Pour le Wiktionnaire, plus on les accumule plus il devient difficile de trier les infos (c'est comme pour le classement des médias sur Commons, cela ne coûte rien de classer assez tôt pour pouvoir retrouver les éléments facilement et éviter des tonnes de doublons ou laisser des tas d'erreurs non détectées et non corrigées).
De plus toutes les tentatives de classements génétiques ont échoué pour l'instant (du fait que toutes les langues s'enrichissent de leurs voisines et ont des ancêtres multiples ne formant pas des hiérarchies exactes, mais des tas de branches qui se recoupent ou se recouvrent, la question étant de savoir à quel taux, ce qui est impossible de déterminer avec précision sur des corpus très faibles comme l'indo-européen qui n'est que reconstruit sur une théorie, et où même le phénicien n'a pas de texte plus long que 2 lignes sur un sarcophage, le reste étant des noms de personnes ou toponymes pas toujours identifiés).
Les familles "proto-" sont toutes supposées, impossibles à prouver et non normalisées, et la seule façon de ranger ce qu'on a c'est par période et groupe géographique pour les langues mortes. Les langues ne sont pas des organismes vivants, elles n'ont pas d'ADN et leur évolution n'est pas déterminée par leur patrimoine hérité ni par leurs seules mutations naturelles, mais beaucoup plus par les croisements. Il n'y a pas de "barrière des espèces", les langues sont toutes des var comme on cultive des hybrides de roses, avec aussi des tas de greffes emruntés à des pieds différents. Les langues ne se reproduisent pas et ne font pas de graines, même si elles sont véhiculées par des populations de personnes (pas uniques mais mélangées).
Et ce n'est pas l'avis de 2 linguistes, qui suffiront. Même la liste The Linguist ou l'ISO en convient, ils doivent se mettre d'accord avec les autres pour former un consensus. Je ne vois pas pourquoi tu viens citer ces 2 là et pas les autres. Même si des catégories ISO 639-5 ont "peut d'intérêt" pour toi, elles sont mieux que pas de catégorie du tout pendant des décennies (ou des siècles, car il n'est pas prouvé du tout que la classification génétique aboutira jamais à quelque chose formant un consensus concernant les langues mortes ou les langues aujourd'hui rares très créolisées et presque sans corpus même si elles existent encore). verdy_p (d) 25 avril 2013 à 13:30 (UTC)
Tu me prêtes des propos que je n’ai pas tenus. J’interviens ici à titre de modérateur. L’immense majorité des codes langues du wiktionnaire suivent la norme ISO 639-5. Si ça ne me satisfaisait pas, je n’aurais, crois moi, pas attendu ton intervention pour m’exprimer. Je trouve juste normal, en tout cas c’est le principe retenu sur ce wiki, de te demander des éclaircissements au sujet de modifications que tu as apportées et qui ont provoqué des contestations. Sinon, n’importe qui fait n’importe quoi et on laisse faire. Si j’ai cité ces deux personnes, c’est que justement ce sont elles qui se sont exprimées depuis ton intervention. Après ça, je laisse aux protagonistes le soin de défendre leur point de vue. Ce que tu as clairement fait maintenant. Pour ma part, je trouvais curieux la création de certaines catégories ajoutées par tes soins, (et encore une fois je n’ai dit nulle part que les catégories ISO 639-5 ont "peu d'intérêt" pour moi) comme par exemple celles correspondant à une famille nord-amérindiennes ou basque que l’on ne retrouve pas dans nombre de travaux n’y dans ethnologue.com. — Unsui Discuter 25 avril 2013 à 15:16 (UTC)
La famille basque est là parce qu'elle est décrite dans Wikipédia anglophone, c'est un parallélisme de catégorie, qui permet d'offrir un lien vers l'espace de discussion. Après ça on peut toujours discuter du fait de la séparation ou non des langues vasconiques et de leur étendue (certains basques veulent y inclure d'anciennes langues celtiques par exemple). JE n'ai pas inventé cette catégorie puisque ISO 639-5 la définit depuis le début et ne l'a pas retirée.
ISO 639 n'est pas parfait (par exemple l'ISO 639 au début ne devait contenir aucune famille de langues dans ses volets 1 à 3, pourtant maintenant on a:
  • le chinois (pour lequel ISO 639 a inventé le concept de macrolangue du fait que l'intelligibité mutuelle est assurée à l'écrit, mais uniquement depuis la révolution populaire et la normalisation qui y a eu lieu (simplification des sinogrammes et changement sémantique pour définir plus de composants de type phonogramme). Mais parmi les langues chinoises comprises dans la macrolangues bon nombre ne sont pas intelligibles à l'oral entre elles.
  • Le bihari (sur lequel j'ai souligné l'incohérence et qui a été corrigée plus d'un an après le signalement car si l'anomalie était reconnue, l'ISO 639-5/MA n'avait plus aucune administration suite à un départ en retraite non remplacé et le signalement oublié puis resignalé et qui a mis a nouveau plusieurs mois à être publié alors que tout le monde dans l'ISO 639 a reconnu l'anomalie)
  • On a eu depuis les langues apaches (une famille et plus une macrolangue; il s'en est fallu d'un cheveu qu'il y ait équivalence avec la macrolangue apache par unification des codes ISO639-3 et ISO 639-1; mais les langues apaches ont leur code séparé en tant que famille).
  • Des corrections ou ajouts, il y en aura d'autres, on pourra les suivre d'autant plus facilement qu'on aura préparé le terrain en faisant le tri préalable.
En attendant Wikimedia a besoin des codes ISO 639 pour tout, en fait indirectement via BCP 47 qui y fait référence et qui inclut bel et bien des codes de familles, même si toutes n'y sont pas présentes).
Bref je n'invente rien mais je continue un travail déjà commencé basé sur des discussions qui ont déjà eu lieu au sein des projets Wikimedia et depuis quelques mois dans le Comité des langues Wikimedia, de suivre les normes le mieux possible, quand elles existent (ce qui n'empêche pas pour autant d'ajouter d'autres catégories plus fines pour d'autres familles non encore standardisées (ce qui a été fait ici... mais pas par moi).
Heureusement Wikimedia ne prend pas non plus ses décisions juste parce que 2 de ses membres pensent autrement dans leurs propres travaux, même s'ils sont compétents, car c'est à eux de convaincre le reste de la communauté scientifique de standardiser leurs travaux. Et là ce n'est pas évident, la classification des langues, surtout les langues vivantes, est hautement sensible politiquement : en témoigne le serbo-croate et le chinois entre la volonté politique établie en norme et l'avis des linguistes).
Et ce n'est pas plus simple non plus si on se contente du niveau des écritures (objets des travaux de l'Unicode et l'ISO/IEC 10646), et des régions du monde ISO 3166 (avec en plus de puissants intérêts économiques et stratégiques contre lesquels la communauté Wikimedia est incapable d'imposer seule son point de vue, quand l'industrie informatique toute entière a choisi d'utiliser BCP 47 (une liste des dernières RFCs à jour de l'IETF) et indirectement les normes ISO ou règlements ONU associés, en demandant aussi et obtenant la stabilité des codifications non assurées par l'ISO 639 ni l'ISO 3166 : un code une fois ajouté dans BCP 47 est garanti continuer à exister même si d'autres codes moins ambigus sont créés plus tard (pour permettre de reclasser les informations autant que possible sans avoir à faire cela du jour au lendemain y compris pour les documents archivés, ou bien des mécanismes sont ajoutés (comme celui introduite avec l'ISO 639-3 pour les "groupes de langues" de l'ISO 639-2 et -1 afin d'obtenir une compatiblité ascendante avec l'ISO 639-5, voulue par les linguistes, les traducteurs, et les utilisateurs d'applications et bases de données localisables comme OSM, Wikipédia, le Wiktionnaire et toutes l'industrie des médias). verdy_p (d) 25 avril 2013 à 16:52 (UTC)
Note: Ethnologue.com n'est pas une référence exemplaire non plus. La liste de discussion de TheLinguist est beaucoup mieux informée et recense beaucoup plus de recherches (mais ne statue pas sur ce qui fait consensus ou pas, elle recense ce qui existe et a fait l'objets de travaux et c'est tout). Au point que Ethnologue.com y participe mais n'a pas pour but d'être aussi exhaustif non plus (notamment en matière de classification des dialectes et des langues mortes, il s'intéresse aux langues vivantes ou à celles qui ont un corpus oral ou écrit conséquent. ISO 639 est lui aussi uniquement un extrait de ce que recense ISO 639 dans ce qui ne fait pas débat (ou n'en a pas fait avant la normalisation, faute de participants suffisants pour relever les anomalies à temps et faut d'intérêt des gouvernements membres de l'ISO mais qui ne participent pas aux comités de normalisation et ne font pas connaitre leur opinion ni souvent celle de leurs minorités ou départements scientifiques ou universitaires, publics ou privés).
On a besoin d'une base stable pour avancer et pour l'instant BCP 47 fournit le cadre idéal et n'empêchera pas les corrections ultérieures si nécessaire (et ce sera plus facile si on a préparé le terrain en faisant le tri à l'avance pour mesurer correctement l'étendue des corrections à faire et faciliter la reclassification : dans Wikimedia c'est très simple de reclasser toute une catégorie, et plus simple de la diviser en plusieurs parties si elles ne sont pas trop peuplées, on fera moins d'erreurs). verdy_p (d) 25 avril 2013 à 17:03 (UTC)
Tu dis : "Heureusement Wikimedia ne prend pas non plus ses décisions juste parce que 2 de ses membres pensent autrement dans leurs propres travaux, même s'ils sont compétents". Soit, mais je trouve que, malheureusement, avancer comme argument d’une famille basque : "La famille basque est là parce qu'elle est décrite dans Wikipédia anglophone" est on ne plus plus pauvret et indigent et ne vaut pas mieux, tant s’en faut. Et si tu pouvais ne pas délayer tes arguments dans une telle logorrhée — style départ en retraite de tartempion —, ça serait profitable à tous. Ce n’est pas Wikipédia ici.Unsui Discuter 26 avril 2013 à 08:48 (UTC)
« Ce n'est pas Wikipédia ici ». Effectivement mais cette page de discussion perso n'est pas le Wiktionnaire non plus, c'est une discussion informelle, et si je ne peux même pas donner mon avis sur ce qui est ma page de discussion (même si d'autres peuvent y venir y donner leur avis, alors les pages de discussion par utilisateur n'ont pas leur place sur le Wikitionnaire, pas plus que sur Wikipédia, et on ira discuter sur d'autres sites et personne ne saura même qu'un sujet a fait l'objet de discussions. Wiktionnaire et Wikipédia y perdront toute leur âme ! JE pense que tu n'as pas réfléchi en sortant cela, tu réinventes le pourquoi et le comment des pages de discussion utilisateur. verdy_p (d) 27 avril 2013 à 13:18 (UTC)
Encore une fois tu déformes ce que j’ai dit : je n’ai jamais dit que tu ne pouvais pas donner ton avis. J’ai dit qu’il fallait le donner plus clairement pour qu’il soit compris de tous et ce sans noyer le poisson. Et je suis d’accord avec toi sur un point : si je ne peux pas moi non plus donner mon avis ici, c’est pas la peine de discuter. — Unsui Discuter 27 avril 2013 à 14:09 (UTC)
Tu mélanges plusieurs choses. Les codes ISO ne visent pas à une classification mais à un inventaire.
Ils ont d’abord été établis par la SIL, selon leurs agents de terrain (missionnaires dans la majeure partie des cas). Il se trouve que ces missionnaires, de part leurs objectifs religieux, n’ont pas pu accéder à toutes les régions du monde et sont allé de façon excessive dans d’autres. Du coup, il manque des codes ISO pour de nombreuses langues tandis que des dialectes ont leurs propres codes ISO. Les études transversales de classification n’ont pas à influer sur l’ISO comme il n’y a pas à s’en tenir rigoureusement à des codes lorsque des études plus récentes montrent que deux codes correspondent à une seule langue avec deux dialectes.
Non ! Dès le début ils ont été fait pour la classification (d'abord bibliographique, puis terminologique). Ils ne visent pas du tout à un inventaire. Et l'usage des codes ISO dans BCP 47 est bel et bien destiné aussi à la classification, même si elle est incomplète ou imparfaite. Et le Wiktionnaire n'est pas voué à n'être qu'un inventaire ou qu'une classification. Etant donné qu'on utilise les codes ISO pour la classification et qu'on veut les utiliser aussi pour faire un inventaire de toutes les langues en évitant de tout mélanger, les usages sont mixtes. Ce qui nécessairement implqiue qu'on a des classifications incomplètes, mais qui se veulent suffisantes autant que possible sans tout mélanger. Il n'y aura jamais de classification parfaite concernant les langues du monde, et jamais non plus un inventaire complet (ce n'est pas le but du tout des codes ISO, et encore moins dans BCP47 utilisé ici pour classer nos définitions) verdy_p (d) 27 avril 2013 à 13:18 (UTC)
Il me semble qu'il serait profitable pour tous d’écrire une page d’explication sur la classification présentée sur le Wiktionnaire. Quelque chose comme Wiktionnaire:Classification, sur laquelle nous présenterions ISO 639, BCP 47 et notre façon de traiter l’affaire. Qu’en dis-tu ? Sourire Eölen 26 avril 2013 à 10:13 (UTC)
Il y a déjà les pages pour Wiktionnaire:ISO 639-1,Wiktionnaire:ISO 639-2, Wiktionnaire:ISO 639-3, Wiktionnaire:ISO 639-5 et Wiktionnaire:BCP 47, qui contiennent un résumé des codes, les liens de références croisés, les renvois aux articles Wikipédia. Si quelquechose est à écrire c'est sur Wikipédia. Au delà il y a aussi déjà une page consacrée aux choix éditoriaux du Wiktionnaires (conventions, etc...). verdy_p (d) 27 avril 2013 à 13:33 (UTC)
Justement, il n’y a pas de convention qui précise comment nous nous appuyons sur les différents inventaires ISO pour organiser nos catégories liées aux familles de langues. Ce qu’il serait peut-être bon de préciser quelque part. Eölen 27 avril 2013 à 21:04 (UTC)
« En ce sens, une famille comme "langues nord-amérindiennes" par exemple est contestable et de toute façon d’un piètre intérêt, qu’elle possède un code ISO ou pas. » (Unsui) Coïncidence, cette semaine, dans http://fr.wikipedia.org/ , Florn88 a ajouté le portail:Nord-Amérindiens aux articles de langues amérindiennes d'amérique du Nord (voir aussi les catégories de langues incluses dans w:Catégorie:Culture amérindienne d'Amérique du Nord). Visite fortuitement prolongée (discussion) 26 avril 2013 à 20:42 (UTC)
« Les codes ISO [...] ont d’abord été établis par la SIL » (Eölen) Non. Ils ont d'abord été établis par la bibliothèque du parlement fédéral des ÉUA. Visite fortuitement prolongée (discussion) 26 avril 2013 à 20:42 (UTC)
@Visite fortuitement prolongée : oui. Et alors ? Encore heureux qu’il y ait des gens qui défendent cette famille. Sinon elle ne serait pas contestable puisque tout le monde serait d’accord pour qu’elle n’existât pas. — Unsui Discuter 26 avril 2013 à 21:03 (UTC)
@Unsui: VFP a raison ! Et il démontre lui aussi que les codes ISO ne visaient pas à un inventaire mais bien à une classification (bibliographique). Même imparfaite car les ibliothèques ont besoin de classer leurs collections en attendant que des chercheurs s'y intéressent et se mettent d'accord (cela fait des siècles qu'il essayent et ne parviennent à rien de concret, alors que les chercheurs seraient les premiers à critiquer les bibliothèques si celles-ci étaient incapables de classer un peu leurs collections pour que les chercheurs puissent aller y chercher quelque chose). Le Wiktionnaire a d'assez près les mêmes objectifs qu'une bibliothèque, il n'est pas là pour faire le travail des chercheurs qui ne sont pas d'accord entre eux, alors que les mêmes chercheurs ont besin d'une terminologie commune pour parler au moins sans trop d'ambiguité de certains sous-ensembles (car parler de les 7000 langues codées et de toutes les variantes est impossible) ! Bref les codes ISO (en fait les codes BCP47 pour la codification des langues elles-mêmes) ont du bon ! Mais cela n'empêche pas de rajouter d'autres catégories plus fines. verdy_p (d) 27 avril 2013 à 13:26 (UTC)
@Visite fortuitement prolongée : Je ne trouve pas d’information sur les personnes à l’origine de l’ISO 639, si vous avez une source, ça m'intéresse. Je peux en tout cas lire sur le site de la SIL :
  • This is the official site of the ISO 639-3 Registration Authority
C’est donc bien la SIL qui est en charge des codes de langue, ce qui implique les biais dont je parlais plus tôt et ailleurs.
@Unsui : Conclusion totalement fausse ! voir plus bas. Tu n'as rien compris aux normes ISO, et n'en a strictement rien lu. verdy_p (d) 28 avril 2013 à 18:49 (UTC)
@Verdy p: Tu te trompes d’interlocuteur. Je ne suis pas l’auteur de la phrase ci-dessus et n’ai d’ailleurs fais aucune conclusion sur les codes ISO. Fais un peu attention svp. — Unsui Discuter 28 avril 2013 à 19:10 (UTC)
@Verdy p : J’ai dû rater l’explication sur le but de classification attribué aux codes ISO. Par qui ? Est-ce le but de l’ISO en lui-même ou celui de la SIL ? Car la classification présentée sur ethnologue ne fait pas consensus et forme une chose distincte de la norme internationale. Nous n’avons pas à la suivre. Sourire Eölen 27 avril 2013 à 13:37 (UTC)
« @Visite fortuitement prolongée : oui. Et alors ? Encore heureux qu’il y ait des gens qui défendent cette famille. » (Unsui) Alors cela donne un autre éclairage sur votre affirmation « une famille comme "langues nord-amérindiennes" par exemple est contestable et de toute façon d’un piètre intérêt », sans la réfuter. Visite fortuitement prolongée (discussion) 27 avril 2013 à 20:38 (UTC)
À tous : je vous propose de créer une Catégorie:Langues amérindiennes. Visite fortuitement prolongée (discussion) 27 avril 2013 à 20:38 (UTC)
Les catégorisations géographiques existent déjà, même si elles ne sont pas forcément très remplie. Voir Catégorie:Langues par continent. Eölen 27 avril 2013 à 21:04 (UTC)
« C’est donc bien la SIL qui est en charge des codes de langue » (Eölen) Non. Même si la SIL était en charge des codes de langues ISO 639-3, cela n'impliquerait pas que la SIL soit en charge des codes de langue ISO 639-1 et ISO 639-2 (ces derniers comprenant le code « nai » pour les « langues nord-amérindiennes »). Visite fortuitement prolongée (discussion) 27 avril 2013 à 20:38 (UTC)
En effet, mais je n’ai pas réussi à trouver qui avait décidé de ces codes. Auriez-vous une référence à nous proposer ? Eölen 27 avril 2013 à 21:04 (UTC)
C'est vrai que la SIL sur Ethnologue avait proposé une classification mais elle a été officiellement abandonnée (dès que l'ISO 639-3 a été votée en fait concernant les langues codées, puis concernant celle des familles, elle ne propose plus aucune codification et affiche les codes ISO 639-5, et elle les docuente tous, même s'ils font débat).
La SIL n'utilise donc plus du tout sa codification, mais seulement la codification ISO (qu'elle ne décide pas elle-même, même si elle en est la Registration Authority pour ISO 639-3, en charge de seulement publier la norme (mais dans laquelle elle n'a même pas le droit de vote, mais où elle n'agit que comme un des groupes experts, parmi d'autres comme les éditeurs de LinguistList.org et ceux choisis par le comité ISO, par exemple Unicode CLDR qui un un rôle uniquement de liaison). La Registration Authority pour les écritures c'est l'Unicode Consortium. La publication des codes ISO par les RA, se fait selon les conditions de licence de l'ISO, pas celles du site hébergue. Le droit de propriété applicable est défini par l'ISO, pas par la RA.
Ne pas tenir compte du nom du site de la RA, cela n'a strictement aucun rapport carla RA n'est pas en droit de définir quoi que ce soit !!! Une RA n'a qu'un rôle purement administratif, qui est de conserver et transmettre les demandes de correction ou d'informations, et de publier les décisions. LA RA peut changer sans que cela remette en cause quoi que ce soit à la norme ou la façon d'en décider.
Bref ceux qui décident des codes ISO, c'est.. le comité de travail ISO lui-même. verdy_p (d) 28 avril 2013 à 18:46 (UTC)
Merci pour cette explication très claire ! Ces précisions mériteraient de figurer sur Wikipédia (à défaut d’être sur le site de la SIL). A la lumière de ces explications, il paraît en effet indispensable que nous indiquions ces codes pour les langues qui en disposent, ce qui n’est pas toujours le cas. A voir comment indiquer ces codes (je pose la question sur la Wikidémie). Et comment ils peuvent s’articuler avec la structure catégorielle des langues. Sourire Eölen 28 avril 2013 à 21:38 (UTC)
C'est bel et bien marqué sur le site de la SIL. Mais il faut comprendre le sens du terme "Registration authority" si on ne fait que lire la courte mention en tête de page. Pour le reste, le site de la RA (qui n'est pas réellement le site de la SIL et a un contenu éditorial clairement séparé) mentionne tous les détails et notamment contient les liens vers la norme ISO, publiée avec une traduction officielle en français (d'égale valeur à celle en anglais).
La SIL publie d'autres informations hors de la norme, sur des pages qui ne sont pas affublées du logo "ISO", ces pages sont hors de la norme ISO, même si les tableaux de données des pages de codes ISO contiennent des liens (informatifs et non normatifs) vers des pages SIL, ou tous les autres références que l'ISO jugera bon de devoir inclure (cela inclut par exemple les pages vers Linguist.org, ou des pages de divers académies ou départements linguistiques, ou bibliothèques nationales, ou d'autres travaux de recherche, mais la norme ISO est une norme ISO, pas un standard SIL (qui a totalement abandonné son ancienne codification autrefois mentionnée par elle dans sa publication dans The Ethnologue ; The Ethnologue ne mentionne plus QUE des codes ISO et aucun autre : quand il détaille une langue codifiée ou une famille en créant des sous-familles ou groupes de langues ou variétés de langues, The Ethnologue se contente de donner les noms locaux et en anglais et queles synonymes éventuels; Mais The Ethnologue est beaucoup moins riche que ce qu'on trouve aujourd'hui sur la LinguistList.org qui n'est pas non plus une norme mais juste un état des recherches en cours, avec diverses positions souvent contradictoires selon les sources, mais que LinguistList.org continue de référencer séparément). verdy_p (d) 29 avril 2013 à 08:00 (UTC)
Puisqu’il nous faut rester neutre vis à vis de tout ça, le mieux ne serait-il pas alors de présenter plusieurs analyses différentes, concurrentes, et de faire de la multicatégorisation, de créer plusieurs hiérarchies parallèles différentes, chacune appuyées sur des références ? Pour le cas ci-dessous mentionné : oui, le basque est une langue isolée et oui, le basque est une famille de langue. Dans l’entrée basque on défini les deux sens, en rapportant des références pour l’un et pour l’autre puis Catégorie:basque sera catégorisé dans Catégorie:langues isolées et dans Catégorie:langues basques. Qu’en dites-vous ? Sourire Eölen 29 avril 2013 à 22:37 (UTC)
En citant la LinguistList.org, qu’est-ce que tu cites exactement ? Multitree.org ? Celui-ci utilise des codes ISO 693-3 mais aussi ses propres codes de langues dans certains cas, en plus des ses propres codes de sous-groupes et suffixes de dialectes. --Moyogo (discuter) 30 avril 2013 à 05:13 (UTC)
Je n'ai pas dit que LinguistList n'utilisait pas les codes ISO 639, bien au contraire. Mais seulement que ce site fournit des classifications plus détaillées (je met le pluriel à "classifications" exprès, car il y en a souvent plusieurs candidates, avec leur partisans et leurs opposants. Ce qui veut dire que quand il y a accord avec les familles ISO les codes ISO sont affichés. Sinon ils sont effectivement leurs propres codes mais distincts pour les familles non encore codées par l'ISO (les plus nombreuses), ces codes ayant un format différent. Tout le monde s'est mis aux codes de la norme ISO 639, quand ils existent. Et parmi les familles candidates sur LinguistList, toutes n'ont même pas de codes proposés, notamment quand la terminologie est ambiguë.
Autant que possible LinguistList évite (de même que les chercheurs), en cas de redéfinition ou reclassification d'une famille de réutiliser les mêmes termes. Les termes déjà définis dans l'ISO 639 seront gardés, de même que des termes déjà consacrs largement par la littérature sur le sujet, même si des familles sont considérées obsolète. LinguistList en revanche s'intérese peu à la distinction entre ce qui est une langue (ou une macrolangue) et un dialecte : cette distinction est en fait assez difficile à faire, il n'y a pas de limite franche, en dehors de ce qui est codé dans l'ISO. Ce qui veut dire que LinguistList considère souvent tous les dialectes d'une langue comme format une famille, que l'ISO codifie comme une seule langue ou macrolangue. Mes macrolangues n'ont pas de réalité linguistique, c'est un concept inventé par l'ISO uniquement pour des raisons de compatiblité avec les premières versions de l'ISO 639, quand il est impossible de transformer une langue ou macrolangue de l'ISO 639-1/2/3 en famille ISO 639-5 (car cette dernière ne peut contenir aucun code utilisé auparavant dans ISO 639-1/2/3). Ces macrolangues sont des exceptions, très peu nombreuses en comparaison de tout le reste. De plus pour des raisons politiques, certains dialectes d'une même et unique langue acquière le statu de langue du fait de leur reconnaissance officielle à part (cas du serbocroate, du normand (dialecte lui-même du français selon ISO 639, dont certaines variétés acquière le statut de langue séparée alors qu'au minimum ces variétés devraient devenir des membres d'une même macrolangue.)
LinguistList ne cherche pas à entrer dans ces débats essentiellement politiques (où les variétés lingusitiques ont beaucoup de mal à se voir appelées "dialectes" ou "langues" distinctes ou "familles". Les classifications LinguistList sont donc basée sur une hiérarchie où on passe sans discernement des niveaux hiérarchiques d'une catégorie "famille" à langue" ou "dialecte". Pour plus de détail, il faut regarder les références qui détaillent les niveaux d'intercompréhension entre elles, ainsi que les héritages multiples, les évolutions dans le temps, leur créolisation (qui a pour conséquence la multiplicité des parents et donc des hiérarchies et des débats sur les familles de langues les plus pertinentes) ou assimilation (qui change le contour d'une famille en en réduisant une pour en étendre une autre) ou reséparations parfois à marche forcée (bosnien, serbe, croate, moldave dans sa variante "slavisée" et non dans sa variante la plus romane qui suit le chemin inverse vers une langue roumaine devenant une langue chapeau...). verdy_p (d) 1 mai 2013 à 00:10 (UTC)
Cette longue explication ne répond pas aux deux questions posées précédemment. Je me permets de les rappeler. Moyogo demandait à quoi correspondait LinguistList pour vous. Pour ma part, je vous demandais si il ne serait pas mieux de ne privilégier aucune classification mais de toutes les faire en même temps, en catégorisant de plusieurs manières chaque langues, selon les théories en vigueur. Merci pour vos futures réponses là-dessus Sourire Eölen 1 mai 2013 à 22:12 (UTC)


basque [modifier]

Bonjour,

Après une simple recherche, j’ai pu lire que « Pour des raisons méthodologiques, il existe un large consensus parmi les linguistes bascologues, à défaut de preuves irréfutables de rattachement, pour considérer le basque comme une langue isolée. »

Qu’en penses-tu ?

Cordialement, Automatik (discussion) 28 avril 2013 à 19:38 (UTC)

J'ai toujours été d'accrod avec ça, ce n'est pas le problème. LA seule chose est que selon les sources c'est la définition de ce qu'on appelle "langue isolée" qui pose problème, selon qu'on se restreint aux seules langues vivantes ou si on inclue les langues mortes ou reconstruites artificiellement.
Et c'est là qu'il existe bel et bien une famille vasconique, dans laquelle le basque moderne n'est pas isolé. Historiquement il ne l'a pas été et a coexisté avec d'autres langues de la famille, même si cette famille est issue d'une seule une langue "vasconne" (aussi appelée 'vieux basque") encore très mal connue, aussi différente que peuvent l'être le français moderne et le "vieux français"
— Note: le vieux français n'est en fait qu'une langue de l'ancien parler roman du centre de la France, qu'on devrait appeler "vieil orléanais" et dont l'héritier le plus proche n'est pas le français moderne standard actuel, créé artificiellement au XVe siècle en mélangeant diverses langues d'Oil et d'Oc parlées dans le Royaume de France) mais les "dialectes" orléanais et angevin, mais avec une base lexicale latine vulgaire autrefois beaucoup plus prononcée, car ces dialectes modernes ont largement été créolisés entre eux et influencés par la normalisation du français, très récente dans l'histoire ; cette normalisation du français s'est faite en plusieurs étapes d'ailleurs, puisque la création du français est d'abord passé par le "françois" ou "françoys", qu'on appelle souvent "moyen français" un peu abusivement car il n'incluait pas encore les langues d'Oc et ne fixait pas encore bon nombre de termes ni la grammaire, ni lorthographe avec les accents actuels). —
Hors si on reprend toutes les "familles" de langues, elles ont toutes comme membres à la fois des langues vivantes et des langues mortes. Le terme "isolat" est dépendant uniquement de la période historique sur laquelle on regroupe ou pas les langues. Et c'est bel et bien ce que code l'ISO (même si la famille vasconne est un peu abusviement appelée "famille basque" dans l'ISO, c'est bien la famille vasconique qui est codée séparément de la langue basque elle-même.
Je ne veux pas rentrer dans ce débat, ni sur la pertinence ou non de la famille vasconique qui a ses soutiens et mérite qu'on lui donne une définition sur le Wiktionnaire correspondant à ce qu'en disent ses défenseurs (même du point vue NPOV, on ne peut pas exclure du Wiktionnaire une définition utilisée sous prétexte que certains ne soutiennent pas l'idée. La langue basque ancienne a pourtant été très mal étudiée par les défenseurs de la langue basque unique (qui n'est unique que parce qu'ils considèrent uniquement la langue moderne).
Moralité: il n'y a pas une et une seule classification hiérarchique des langues mais plusieurs qui s'entrecroisent et dans laquelle coexistent des familles qu'on peut tout à fait gérer simultanément dans des catégories du Wikitionnaire, une catégorie d'excluant pas l'autre, tant qu'il n'y a pas d'ambiguité sur la terminologie pour les nommer. Toute la difficulté est que les langues n'ont pas de lignées pures, elles ont toutes des emprunts lexicaux, pholologiques, syntaxiques avec d'autres langues, et ont toutes été fortement influencées par la géographie politique ou physique. verdy_p (d) 29 avril 2013 à 08:00 (UTC)
Pourquoi enlever la mention de langue isolée et la remplacer par membre d’une famille de langues, en somme ? Là tu n’as pas rajouté un point de vue, tu en as remplacé un par un autre d’après ce que j’ai vu ; me trompé-je ? Cordialement, Automatik (discussion) 29 avril 2013 à 10:06 (UTC)
Bonjour,
Je t’ai posé une question ci-dessus, restée sans réponse. Par ailleurs, tu annules les informations des autres sans en parler au préalable, alors qu'il y a controverse. En es-tu conscient ? Si oui, pourquoi imposer un point de vue de manière si rigide, quand il n’y a pas consensus ?
Cordialement, Automatik (discussion) 5 mai 2013 à 14:44 (UTC)

Wiktionnaire:BCP 47 et ses sous-pages [modifier]

Bonjour,

À propos de toutes les pages en BCP-47, j’aurais quelques suggestions à faire, que je présente ci-dessous en plusieurs points :

  • Changer automatiquement les occurrences des 2029 en 2009 : certaines dates affichent cela, j’en ai déjà corrigé, mais la coquille semble être répandue à grande échelle
  • Mettre un résumé introductif à Wiktionnaire:BCP 47, et éventuellement une courte explication en en-tête de chaque sous-page, car quand on arrive sur ces pages, on ne comprend pas vraiment ce qu’elles présentent si on ne maîtrise pas déjà la question.
    Il serait intéressant que le résumé introductif spécifie le lien qu’entretiennent ces listes de codes avec le Wiktionnaire, car ce n’est pas évident (j’ai trouvé par exemple une inclusion du modèle {{modèle désuet}} dans ces tableaux — que j’ai enlevé —, ce qui dénote que ces listes de codes sont peut-être indépendantes des choix du Wiktionnaire, notamment car certaines sont peut-être redondantes avec les codes ISO (? — là encore, je donne ma langue au chat)

Cordialement, Automatik (discussion) 1 mai 2013 à 18:44 (UTC)

Oui, je pense aussi que ça n'a rien à voir avec le Wiktionnaire, il s'agit de renseignements encyclopédiques inutiles sur le projet. Lmaltier (discussion) 1 mai 2013 à 18:46 (UTC)
Les dates 2029 étaient celles quand BCP 47 a été importé mis était encore à l'état de version alpha. —- Donc non ce n'était pas des "coquilles" comme tu dis, il n'y avait strictement aucune erreur, mais cette date mentionnait que la publication n'était pas encore finalisée à l'époque (regarde les dates de l'historique). — Peu de choses ont changé depuis la publication, mais la base devrait être mise à jour (j'ai fait en sorte que ce soit le plus facile possible en utilisant des modèles compacts contenant les données mais je n'ai pas repris encore les 7000 langues pour comparer les listes depuis le registre IANA.
Ces pages sont uste des points d'entrées et n'ont pas à documenter plus de choses que les noms attribués et les codes assignés. Ils ont à voir avec le Wiktionnaire mais hors de la section principale parce qu'ils documentent ce qu'on utilise, et fournissent les pointeurs vers les références et les autres définitions possibles. Ces pages ont vocation à pointer vers Wikipédia. Elles ont aussi vocation à contenir aussi des pointeurs internes vers les articles du Wiktionnaire pour voir s'ils sont tous définis, et vérifier/comparer les orthographes (aussi parce que dans certains cas le Wiktionnaire nomme les langues différemment des normes référencés), ce qui justifierait donc de définir aussi les synonymes avec de vraies entrées de termes pour chacune dans le wiktionnaire.
Le but de ces pages est toutefois d(être très compact, pas de détailler toutes les définitions. Il n'y a pas tant de pages que ça, les plus nomreuses étant cependant pour les codes 7000 ISO 639-3 qui pour des raisons de taille ont dû être éclatés en plusieurs sous-pages (une par unitiale ou par type de code). Cela ne fait pas beaucoup et leur volume est très réduit.verdy_p (d) 1 mai 2013 à 20:04 (UTC)
Note : les codes BCP 47 et les codes ISO ne sont pas les mêmes, donc pas de redondance (l'objet même de ces créations était qu'ici tout le monde confond tout entre ces codes, et confond les normes qui n'ont pas le même objet, et pas le même format non plus, les codes BCP 47 étant plus riches syntaxiquement et incluant des codes spéciaux destinés à la classification terminologique, ou lexicographique (pour les écritures), ou lexicale (pour les régionalismes), ou des différences de forme (pour des langues non écrites), ou des usages spéciaux (documents multilingues, neutres lingusitiquement, ou de langue inconnue), que les codes ISO 649 ne couvrent pas). Tous les codes ISO ne sont pas dans BCP 47, et tous les codes BCP 47 ne sont pas des codes ISO. De plus les codes BCP47 ont préservé des codes qui ont depuis été supprimé dans ISO ou qui ne sont plus recommandés pour BCP 47 mais encore utilisables (ils conservent tous une compatibilité ascendante, et documentent clairement ceux qui sont ambigus et nécessitent des reclassifications).
Ces pages sont là car sinon le registre IANA pour BCP 47 est pratiquement illisible pour le plus grand nombre, par son format juste destiné à être lu par des robots. D'ailleurs c'est à partir des tables IANA que j'ai généré les listes de codes par un traitement semi-automatique à l'origine (recherche/remplacement avec des expressions régulières dans un éditeur de texte externe). Ces pages sont beaucoup plus petites même en taille que le registre IANA lui-même qui contient énormément de redondances. verdy_p (d) 1 mai 2013 à 20:09 (UTC)
tl;dr : redit ça en trois lignes, ça aura bcp plus d’impact. --GaAs 1 mai 2013 à 20:21 (UTC)
3 lignes (puisque tu n'as pas la courage de lire, tu n'en as pas non plus pour lire les normes et donc toi aussi tu confondras tout...) :
  • Pas de redondance, les codes des différentes normes ne sont pas équivalents. Ces tables font les différences clairement là où les wiktionnairiens confondent tout ! Et leur présence ici n'est pas dans le Wiktionnaire mais pour faire les liens avec nos modèles de langues (ce qu'on ne peut pas faire dans un article Wikipédia).
  • Pas de coquille dans le texte concernant les dates en 2029 : la date de publication finale lors de l'import n'était pas encore connue à l'époque et la source mentionnait bel et bien cette date. Bref ne pas changer à l'aveugle 2029 en 2009. Mais mettre à jour avec la source IANA (illisible pour presque tout le monde).
  • Pas de définitions dans ces tables, ce n'est pas leur objet, mais il s'agit de faire le lien avec les modèles utilisés dans ce wiki et les définitions des termes choisi, car le Wikitionnaire n'utilise pas partout le nom de langue en français défini dans ces normes. Bref ce ne sont QUE des données, pas des définitions détaillées. verdy_p (d) 1 mai 2013 à 20:27 (UTC)
Pour les dates, il y avait bien une erreur, puisque j’ai vérifié le document de l’IANA avant de faire les modifs. Exemple : avant mon passage, Wiktionnaire:BCP_47/grandfathered-2 indiqué que le code zh-xiang avait été déprécié en 2029, alors que l’IANA indique bien 2009 [3]. Par ailleurs, si comme tu le dis, BCP 47 n’est pas une norme strictement appliquée sur le Wiktionnaire, mais que ces listes sont là essentiellement pour permettre une vue d’ensemble du contenu du Wiktionnaire sur ce sujet-là, je propose de déplacer ces pages dans l’espace Annexe, qui est davantage adapté.
Pas besoin de définition de ces normes, mais au moins une explication sur l’utilité de ces pages, car d’après ce que j’ai compris, tu cherches à vulgariser le contenu de la liste de l’IANA (que j’ai réussi à comprendre une fois que j’avais réussi à lire les nôtres). Donc une intro explicative pourrait être envisageable, pour donner à ces pages une vraie valeur ajoutée. Cdlt, Automatik (discussion) 1 mai 2013 à 20:32 (UTC)
Je ne vulgarise rien du tout, je recense uniquement des données. Les explications sont pour Wikipédia et sur les références externes citées partout sur les pages (mais concernant BCP 47, tout est en anglais et tout le monde ne peut pas les lire ici).
le Wiktionnaire (ni aucun projet Wikipédia) n'utilise pas directement les codes ISO 639 mais bel et bien les codes du standard BCP 47 (standard du web y compris pour les attributs de langue HTML). Wikipédia définit aussi des codes non standards sur certains noms de domaines des éditions linguistiques de ses wikis, mais pour le HTML c'est bien les codes BCP 47 (mais pas tous les codes ISO 639) qu'il faut mettre dans le HTML généré par toutes les pages wikis (et peu importe si les codes interwikis ne respectent pas cette norme car ils sont en fait associés à des noms de domaines et non réellement des codes langues). verdy_p (d) 1 mai 2013 à 20:41 (UTC)

Tu dis que ces pages documentent ce qu'on utilise. Non, on n'utilise pas ça, elles n'ont donc rien à faire ici. Lmaltier (discussion) 1 mai 2013 à 20:37 (UTC)

Si car ces pages font référence directement aux noms des modèles qu'on utilise et permettent de comparer ce qu'on y a mis avec ce qui est dans les normes pour vérifier la cohérence. Ce sont des pages internes du projet, pas des définitions. Le but n'est même pas la vulgarisation. et ces pages sont HORS de l'espace principal (et très bien référencées sur le web car avec des tableaux de données lisibles), mais n'excluent pas pour autant la référene à la source de ces données. Elles ont autant à faire ici que les pages de suivi de projets divers (à qui il manque une exhaustivité de nos usages).
Et oui, ces pages affichent bel et bien les noms de langue qu'on affiche dans le Wiktionnaire à partir des modèles codés suivant BCP 47. verdy_p (d) 1 mai 2013 à 20:45 (UTC)
Où as-tu vu qu'on utilisait des codes suivant BCP 47 ? En réalité, on utilise les codes ISO-639 (presque toujours, codes dans une des versions de la norme), ou les codes utilisés par la Fondation pour ses noms de sites, ou encore des codes qu'on invente, en cas de réel besoin. Non, on n'utilise pas BCP 47. On n'a pas à vérifier la cohérence, car on n'a jamais cherché la cohérence avec cette norme. Tu penses peut-être qu'on devrait, mais c'est un avis personnel, ce n'est pas ce qu'on fait. Ces pages n'ont donc rien à faire ici, elles ne peuvent que perturber ceux qui les trouveraient et les liraient. Mais tu peux éventuellement les transférer sur Wikipédia, je ne sais pas si elle y seraient utiles, peut-être. Lmaltier (discussion) 1 mai 2013 à 21:06 (UTC)
Au lieu de faire des pages différentes sur les différents codes, il suffirait peut-être de faire un tableau synthétique faisant apparaître par langue les codes ISO, BCP et SIL comme dans http://en.wikipedia.org/wiki/Codes_for_constructed_languages , on y verrait plus clair. Verdy_p. zyva ! Sourire -- Béotien lambda 1 mai 2013 à 22:02 (UTC)
Pour Pour. Avec le nom de la langue (liée à la page décrivant le mot) et le code que nous utilisons ici, avec éventuellement un lien vers le modèle. Quoique ce dernier point, c’est à voir selon la mise à jour proposé par Dakdada Sourire Eölen 1 mai 2013 à 22:08 (UTC)
Non !
  1. D'une part ce tableau sera beaucoup trop long (j'ai déjà essayé, le wiki ne le supporte pas). Le découpage en sous-pages navigables résout le problème. L'expression "il suffirait" ne fonctionne pas.
  2. D'autre part il est déjà synthétique en ne contenant que des données et liant ce qui est à lier. Mais en évitant de tout mélanger (c'était le but : ne pas tout confondre en replaçant ces codes dans leurs contextes d'origine et comprant ce qui est dans le Wiktionnaire).
  3. Enfin les codes SIL n'existe plus ! SIL les a remplacés tous par des codes ISO 639 dès le début de la publication des codes ISO 639-3. SIL demande même de ne plus parler de ses anciens codes.
Bref ce que tu proposes ne change strictement rien (et n'est pas une solution, ce serait même encore pire). Si on met ça sur Wikipédia, il n'y aura aucune comparaison avec ce qu'on affiche dans le Wikitionnaire. C'est bien pour ça que ces pages sont ici, sans explication car ce n'est pas le but, dans l'espace interne au projet.
Ces pages n'ont pas non plus pour objet de faire une recommandation sur le Wiktionnaire, mais servir de pont entre ce qui y est recommandé ou discuté, et ce qui est dans les différentes normes, et ce qui est documenté plus en détail ailleurs. Ces pages sont un sumple état synthétique, et c'est pour ça qu'on y trouve des liens rouges sur des termes pas encore définis dans le Wiktionnaire, ou des modèles pas encore créés (ces liens rouges sont volontaires et il ne s'agit pas de les cacher pour autant). Ces pages ont déjà servi assez souvent à vérifier les codes mal utilisés ou mal définis, ou détecter des ambiguités de langues et des codes qui ne sont plus recommandés et qu'il faudra migrer dans les articles et dans les modèles de langue qu'ils utilisent.
verdy_p (d) 1 mai 2013 à 22:12 (UTC)
En revanche rien n'interdit d'avoir une autre page résument uniquement les codes qu'on a défini et utilisé. Mais attendez-vous alors à une maintenance élevée (cette page existe déjà et demande un travail de mise à jour encore plus difficile, au lieu de simplement rechercher dans une table la plus complète possible qui demande le minimum de travail puisque c'est très résumé et que dela rencoie ensuite vers tout le reste nécessaire).
Parmi les nombreux codes non encore défini ici, ni leur source BCP 47, n i leur source ISO 639-3 ne mentionne des traductions françaises. C'est à nous de chercher, et ces tables ne recommandent rien du tout, mais font juste l'état de ce qui a été défini ici, en comparant avec la source en anglais pour vérifier la cohérence d'ensemble. verdy_p (d) 1 mai 2013 à 22:16 (UTC)

tl;dr [modifier]

Remarque générale : tu ne sais pas être synthétique, et ça te dessert. Si tu savais dire ce que tu penses en trois lignes (et pas trois puces de chacune trois lignes, comme ci-plus-haut), tout le monde t’écouterait bcp plus. Et donc tes avis seraient plus suivis. --GaAs 1 mai 2013 à 20:46 (UTC)

NB : moi je viens de dire ce que je pense en deux lignes (3 avec le NB).Clin d’œil--GaAs 1 mai 2013 à 20:50 (UTC)
Je vois trois items, chacune avec un 2 mots introductifs qui résument le reste des deux lignes.
Il y a des points séparés qui méritent chacun ces 2 lignes (en fait 1 ligne et demie pour chaque item). Total donc : 4 lignes et demie si tu veux.
Désolé mais je ne parle pas le langage SMS. et je dois en plus répondre à plusieurs interlocuteurs en même temps, qui ne veulent en fait jamais rien lire (on se demande ce que font ces utilisateurs ici pour défendre les langues mais qui refusent de les employer). Si on me relance, je suis obligé de répéter ce qui est important. Car ici tout le monde semble survoler les sujets. On ne peut pas survoler une norme qui est comme elle est, même si cela paraît compliqué. verdy_p (d) 1 mai 2013 à 20:51 (UTC)
CQFD. --GaAs 1 mai 2013 à 20:56 (UTC)
Tu peux toujours donner un avis en 3 lignes mais ce ne sera qu'un avis personnel sur quelque chose que tu ne maîtrise pas puisque tu n'as pas le courage de le lire. Comment on peut être allergique à la lecture sur le Wiktionnaire, cela m'échappe complètement : oubliez-vous le but des projets Wiktionnaire qui est bien de préserver les langues ? Et aussi de respecter les normes le mieux possible ? Voilà la culture de l'illettrisme imposé aux autres : on ne dit pas ce qu'on pense, on n'explique rien, mais on donne son avis sans justifier quoi que ce soit. Et cela aboutit à une "culture" imposée par le plus grand nombre qui déforme tout et interprête comme il veut ce que disent les autres, et de ce fait qui ne permet même pas de défendre ses propres idées puisque de toute façon chacun donnera un avis sans savoir et sans même avoir cherché à savoir. verdy_p (d) 1 mai 2013 à 21:01 (UTC)
Le but des projets Wiktionnaire n'a jamais été de préserver les langues, seulement de décrire leur vocabulaire (y compris pour les langues déjà mortes, d'ailleurs). Et le but n'a jamais été non plus de respecter les normes le mieux possible. Il ne faut pas écrire n'importe quoi. Lmaltier (discussion) 1 mai 2013 à 21:11 (UTC)
Le respect des normes n'est pas un avis. Il s'impose dès qu'on utilise des normes comme HTML qui imposent' leur respect. Le Wiktionnaire, comme tous les projets wikis de Wikimédia, n'ont pas toujours compris l'intérêt des normes, mais cela a changé. Le comité des langues de Wikimédia a clairement pris la décision (avec le soutien de nombre de contributeurs) de respecter ces normes au plus près, car cela offre de nombreux avantages en terme d'accessibilité des contenus, lisibilité, et réutilisation. Ton avis s'y oppose peut-être, mais la choix des normes est une décision déjà prise pour tous les wikis de Wikimedia (le comité des langues est venu de la nécessité de collaborer avec diverses communautés, et aussi du fruit des réflexions menées autour des expérimentations de nouveaux wikis. Sans ces normes, Wikipédia et ses projets associés n'auraient jamais eu le succès qu'ils ont eu. Ces normes se sont imposées partout (et pas que chez Wikimedia), même s'il a fallu du temps et que certains ont encore beaucoup de mal à s'y faire (ils voient plus de problèmes dans des détails, pourtant solubles, que d'avantages pourtant évidents tous les jours à les utiliser). verdy_p (d) 1 mai 2013 à 21:27 (UTC)
Nous utilisons évidemment certaines normes, mais le but du projet n'est pas lié aux normes, il est lié à la construction d'un dictionnaire. Les dictionnaires se font toujours leurs propres normes internes, mais ce n'est jamais leur but. Quant aux décisions de Wikimédia, s'il y en a une à propos de BCP 47, je suis intéressé par un lien. Lmaltier (discussion) 2 mai 2013 à 16:23 (UTC)

Au fait, tu te rappelles que je suis un des plus fervent défenseur de certaines de tes contributions (les modèles de langues) ? (une ligne, sans blabla ni fioritures) --GaAs 1 mai 2013 à 21:05 (UTC)

Oui et à cause de gens qui ne voulaient pas lire ni rien comprendre, on a abouti au massacre... Et on est revenu à un désordre ambiant et de grosses difficultés dans les mises à jour, et l'impossibiltié d'assurer une cohérence en centralisant l'essentiel à un endroit plus facilement maintenable. Du coup on surcharge le Wiktionnaire de tonnes de mises à jour et de corrections qui auraient pu être évitées.
Quelle que soit l'expression choisie, courte ou longue, détaillée ou pas, en citant les références ou pas, les mêmes voudront continuer à maintenir leur avis et ne pas chercher à comprendre, même quand on leur souligne leurs propres incohérences ou incompréhensions d'un sujet, si on leur explique et que cela donne une réponse méprisante "tl;dr" on voit bien que tous les efforts sont vains, ils ne respectent pas les efforts faits par l'autre pour chercher à se faire comprendre (mais ils seront les premiers à prendre un terme survolé et sorti de son contexte pour chercher à contredire). C'est très frustrant, mais à la longue je m'y fait. Car avec le temps ils finissent par comprendre (mais ils ne reviendront pas sur leurs discussions ou décisions passées imposées aux autres qui n'ont rien compris non plus).
J'appelle cela la culture du minimum de cerveau occupé, une culture de l'immédiatement consommable, comme une émission de TV où il suffit de zapper sur une autre chaîne pour oublier tout de suite ce qu'on vient de voir ou entendre (de la même façon qu'on jette immédiatement un SMS ou un tweet ou un avis sur Facebook, qui n'offre qu'un avis instantané, surtout basé sur l'émotion, qu'on reproduit vite à l'identique d'un clic sur un lien J'aime ou Retweet, mais jamais sur la réflexion, la même pseudo-culture qui sert à développer à grande vitesse des rumeurs). verdy_p (d) 1 mai 2013 à 21:27 (UTC)
C’est l’hôpital qui se moque de la charité. Tant que tu ne respecteras pas pour les autres contributeurs et leurs avis et que tu continueras à agir en imposant tes points de vue sans concertation, tu n'auras aucun droit de te plaindre. Et ce n'est pas en écrivant des pavés méprisants que tu convaincras qui que ce soit. Es-tu capables de te remettre en question ? — Dakdada 1 mai 2013 à 22:11 (UTC)
Je considère que quelqu'un qui n'a pas le courage de lire 4 lignes et demi et répond par "tl;dr" méprise déjà celui à qui il s'adresse en refusant de parler français (ou même anglais). Il montre son manque de volonté. Comment je me remettrais en question face à quelqu'un qui ne veut pas' faire quoi que ce soit ? Même quand on lui dit qu'il se trompe sur l'essentiel ou qu'il fait des approximations ? J'accepte que certains de mes arguments puissent être contredits, c'est productif, mais tout jeter en refusant de lire ou en reprenant un point discutable (dont on peut parler) pour rejeter tout le reste avec sans le lire, ne fera pas progresser son point de vue ou mieux le préciser.
Quant à imposer mes idées sans concertation, où cela se produit-il ? Ici sur cette page où on est sensé justement discuter et débattre ? Mais où toi même tu refuses et fermes la discussion ?
C'est ton interprétation (ton émotion surtout) qui te guide à réagir ainsi. C'est une mode qui hélas se développe fortement depuis 2005 (et cela s'aggrave). Plus personne ne veut rien lire, et justifie ses avis uniquement par l'émotion ou juste en retweetant l'avis des autres qui n'ont pas lu non plus (autrement dit par rien), et pire, à mépriser ceux qui s'expriment avec des avis motivés : on ne veut plus de justification, juste des gens qui décident sans savoir. verdy_p (d) 1 mai 2013 à 22:23 (UTC)
« Plus personne ne veut rien lire, et justifie ses avis uniquement par l'émotion ou juste en retweetant l'avis des autres qui n'ont pas lu non plus » (Verdy p). Non. Eölen 1 mai 2013 à 22:30 (UTC) (pardon, c’était plus fort que moi)
Verdy_p : as-tu déjà lu la page w:en:Wikipedia:TLDR ? Je conçois que tu te sentes blessé qu'on t'ait répondu tl;dr, mais c'est un reproche de longue date qu'on préfère abréger. — Dakdada 1 mai 2013 à 22:36 (UTC)
Tu devrais la lire jusqu'au bout à sa conclusion : A common mis-citation of this essay is to ignore the reasoned and actually quite clear arguments and requests for response presented by an unnecessarily wordy editor with a flippant "TL;DR" in an attempt to discredit and refuse to address their strongly-presented ideas and/or their criticism of one's own position. This is a four-fold fallacy: ad hominem, appeal to ridicule, thought-terminating cliché, and simple failure to actually engage in the debate because one is supposedly too pressed for time to bother, the inverted version of proof by verbosity. verdy_p (d) 1 mai 2013 à 22:48 (UTC)
Sans vouloir t’embêter, puisque ce n’est pas mon but et que j’apprends des choses en te lisant — et que j’ai osé tout lire, et relire, depuis le début —, je me permets quand même de citer le résumé de w:en:WP:TLDR, qui ne se marie pas forcément avec la conclusion : « This page in a nutshell: Be concise. », résumé avec lequel la citation « I have made this letter longer than usual, because I lack the time to make it short », de Blaise Pascal, se marie bien.
Il y a beaucoup d’infos dans ce que tu dis, mais pour que la majorité saisisse ta pensée, n’en présenter que la substantifique moelle — sans avoir à parler SMS pour autant — serait peut-être la meilleure solution à adopter, pour toi comme pour les autres. Ceci n’est rien d’autre qu’une vision. Cdlt, Automatik (discussion) 1 mai 2013 à 23:57 (UTC) (Je m’arrêterai là, selon ton désir, ayant lu le résumé ci-dessous. Cordialement.)
Pourtant je n'ai pas dépassé les bornes, même concernant ceux qui m'ont contredit à cause de la forme de mes messages, et qui ont dans leurs propres discussions (et depuis longtemps) cherché à motiver leurs avis : leur réponses pour qu'elles soient motivées et pas seulement des avis lancés en l'air, ont besoin de sortir des 2 lignes d'avis personnel. Et cela concerne même GaAs, Dakdata, etc. (qui ont rempli des pages et des pages aussi, et souvent aussi se sont engagé dans des batailles verbales (mais pas toujours en restant corrects), et tout le monde en fait, dès que dans une discussion ce n'est pas l'avis qui compte mais la motivation.
Chacun aura ses avis persos, mais au delà de ça on est de toute façon obligé de lire une réponse dès qu'on l'a demandée ou si on veut contredire quelque chose (la simple contradiction non motivée n'est pas constructive, pas plus que la seule critique de forme, et encore moins le dénigrement sans autre forme de procès, ou les phrases bateau du genre "Moi aussi", "+1", "CQFD", "TL;DR", sans aucun argument avec et qui ne sont que des bouts de phrase applicables à n'importe quel sujet et qui ne disent en fait... strictement rien.). Pour les lecteurs, pas moyen de faire autrement que de faire le tri de ce avec quoi il est d'accord dans les motivations. Mais personne n'accepte facilement un dénigrement, ou un procès d'intention du seul fait de la forme de son langage pourtant correct. Chacun son style.
[long] Il m'arrive très souvent d'être court (d'abord le plus court que je fait c'est quand je décide de ne pas intervenir parce que je n'ai pas d'avis motivé à apporter, une position que certains prennent aussi comme irrespectueuse), et ça le reste tant que cela ne suscite pas des contradictions adverses et non motivées. Je ne demande pas à ce qu'on soit d'accord avec tout ce que j'exprime, mais juste que chacun réfléchisse à ses propres arguments avant de chercher noise sur un détail annexe qui n'est même pas l'objet initial ou une toute petite partie de ce qui est opposé. Sans cette réflexion, je ne vois pas comment on peut se construire un "avis" personnel. On n'agit que comme un mouton sensible uniquement à "l'opinion publique" la plus martelée par celui qui a la plus grande visibilité ou dispose de plus de privilèges que les autres. Et ce n'est pas parce qu'on est d'accord avec l'essentiel de ce que fait quelqu'un qu'on doit aussi accepter tout de lui. Chacun trouvera facilement des arguments à opposer à n"importe qui sans pour autant lui manquer de respect et s'emporter au dénigrement ou une réponse emporte-pièce fermant la discussion comme si elle était une démonstration inattaquable. En tout état de cause, si on demande un avis à quelqu'un, quoi qu'il réponde et s'il motive sa réponse, on trouvera toujours des arguments à opposer. S'il ne motive pas, et qu'on n'est pas d'accord, on trouvera de même que celui-ci ne veut pas discuter et on le lui reprochera. Quoi qu'il fasse, il aura alors tord. Cela n'avance à rien alors de le contacter pour lui demander un avis si on n'est pas prêt à la contradiction intelligente, même si chacun campe sur ses positions (dans cette situation moi je préfère encore ceux qui ont motivé leurs avis contraires aux miens, tant qu'ils autorisent aussi d'autres opinions que la leur et constatent qu'il n'y a pas nécessairement consensus et que ce consensus n'est même pas nécessaire pour avancer). [/long]
verdy_p (d) 2 mai 2013 à 00:58 (UTC)

Vous sortez complètement du sujet. Ce qui vous gêne ici c'est la forme du langage utilisé. Pourtant traditionnelle et qui a été en usage largement sur Internet avant que la mode de Facebook et Tweeter ne finisse par imposer au plus grand nombre un langage vidé de tout sens et tout modèle de réflexion. Mais là je donne mon avis, mais je n'ai jamais empêché les autres d'utiliser ce langage s'ils aiment cela. Mais pour moi ce langage ne sert à rien d'autre que véhiculer l'émotion instantanée. C'est très bien sur Tweeter ou sur un chat, mais pas une page de discussion.

Surtout pas pour aller ensuite à reprocher à un utilisateur sa façon naturelle de s'exprimer sur sa propre page ! Voilà une intolérance manifeste. Bref cette discussion ne mène à rien. Je demande à ce qu'elle soit close. Gardez votre langage et vos avis sur vos pages, ou ici si vous voulez mais ne me reprochez pas de vouloir garder mon langage et mes avis. Au moins je ne copie pas l'avis des autres sans y réfléchir d'abord. Tant pis si vous ne comprenez pas, cela ne changera pas ma vie, pas plus que mon avis visiblement ne change la votre.

Mais je ne vois pas en quoi ma façon d'écrire, qui dès le départ ne veut mépriser personne, constitue un "mépris des autres" qui pourtant viennent me solliciter ici, alors qu'ils savent pertinemment comment je m'exprime (ils n'ont qu'à regarder ce qui est déjà sur cette page). Alors que le mépris qu'on me renvoie comme seule forme de réponse est pourtant évident (raison pour laquelle je ne souhaite pas poursuivre, cela nuirait à mon humeur car personne ne veut voir les efforts que j'ai fait avant en répondant honnêtement (même si je me suis trompé quelque part ce n'est pas la peine de me renvoyer un tel mépris). verdy_p (d) 1 mai 2013 à 22:45 (UTC)

Familles de langues [modifier]

Bonjour,

Pourriez-vous m’expliquer pourquoi vous avez enlevé Catégorie:Familles de langues sur Catégorie:langues chibchanes et Catégorie:langues arawanes ? Eölen 6 mai 2013 à 22:56 (UTC)

Comme sur la wiktionnaire anglophone, ou sur Wikipédia, ou dans l'ISO pour les classer dans une autre famille plus grande.
Le Wiktionnaire anglophone lui emploie des modèles pour gérer les catégories et leurs sous-catégorisation. Car cette classification est vivante et cela simplifie énormément les reclassemrnts (alors que dans les articles on n'a jamasi une vision complète pour voir ce qui manque et ce qui n'est pas défini, ou ce qui devrait être mis à jour). L'optique interwiki pour la cohérence simplifie beaucoup et permet ensuite de définir les autres catégories de familles (là où plusieurs caégorisations sont possibles correspondant à des sources ou des dates différentes. verdy_p (d) 7 mai 2013 à 09:06 (UTC)
Certes, mais ce sont bien aussi des familles de langues, non ? Sur l’utilisation de modèles, ma première impression fut l’incompréhension et je crains qu’il en soit de même pour les contributeurs débutants. Mais je comprends l’intérêt de la chose. Sourire Eölen 7 mai 2013 à 12:40 (UTC)


Par ailleurs, nous discutons sur la Wikidémie de la place à donner aux codes sur le Wiktionnaire. La discussion semble s’orienter vers l’idée d’indiquer le code utilisé sur le Wiktionnaire en {{-note-}} sur les pages des articles. Donc pas sur Catégorie:langues chibchanes mais sur langues chibchanes. N’hésitez pas à apporter votre point de vue à la discussion en cours Sourire Eölen 6 mai 2013 à 22:56 (UTC)

Note ton lien vers la Wikidémie ne mène nulle part. D'après le titre tu discute de l'idée que ce serait une définition lexiale ou pas. C'en est une car on parle bien d'étymologie, et les termes utilisés ont besoin de définitions pour savori ce qu'ils recouvrent (et trouver aussi leurs limites ou différences selon les sources.
Enfin avant de mettre des défitions sur les terms eux-même il faut déjà avoir une idée de leur étendue, et on ne l'a pas encore sans faire de catégories pour recouvrir les langues. Même sans définition, une catégorie est en elle-même une page d'information (sauf que c'est plus facile de maintenir cette liste et la maintenir cohérente et complète. L'autre problème pour définir un terme c'est de trouver le terme français (car souvent les désignations sont ambigues, là où les codes ne le sont pas (indépendant des traductions : exemple "Langues arauanes" ou "arawanes"; "langues arawakes", ou "Arawaks" avec la majuscule des anglophones, et un 's' pour le pluriel, mais pas de 'e' pour le féminin, ou "arawakanes", etc... catégorier avec les codes permet aussi de ne pas butter sur la désignation à utiliser et évite des doublons là où ce devrait être la même définition Regarde la polituque adoptée sur le Wikitionnaire anglophone, c'est instructif et cela fait référence un peu partout car c'est l'espace préféré même par les hercheurs en langues qui y font état de leurs recherches et classification et qui mentionnent leurs références et ouvrages; on n'arrivera pas à égaler cela en français, d'une façon ou d'une uatre s'appuyer sur les normes et limiter l'obsolescence en facilitant les mises à jour, est une bonne chose, srutout quand parmi les 6700+ langues, bon nombre sont mortes, ou n'ont pas de tradition écrite et très peu de corpus, les écrits même pour les langues vivantes étant souvent juste des transcriptions ^lus ou moins phonétiques sur le modèle calqué d'une autre langue plus connue). verdy_p (d) 7 mai 2013 à 09:08 (UTC)
Bizarre, le lien marche pour moi. Tu peux retrouver la conversation dans la Wikidémie. Je ne vois pas en quoi le code ISO est lié à l’étymologie d’un nom de langue, bien souvent il a été choisis a posteriori et n’est en rien lié au mot désignant la langue. La définition d’une langue ne me semble en rien liée au code ISO et donner le code ISO dans la définition ne permet pas au lecteur lambda de comprendre mieux de quoi il s’agit.
Une page de catégorie n’est pas une page d’information, elle sert à relier les informations mais n’est pas là pour en fournir de nouvelles. Pour le terme en français, l’Atlas des langues en danger de l’UNESCO peut souvent donner une première idée. C’est ensuite en rédigeant les pages pour tous les orthographes existants et en cherchant des sources utilisant chaque orthographe que l’on peut voir lequel est le plus utilisé en français et finalement choisir le nom pour la catégorie. Chaque orthographe attestée d’un nom de langue doit avoir son entrée sur le Wiktionnaire. Pour la politique anglaise, je n’en ai jamais entendu parler et je serais intéressé pour savoir d’où tu tiens qu’elle fait référence. Utilisateur:Eölen 7 mai 2013 à 12:40 (UTC)

Je viens de modifier le lien vers la discussion sur la Wikidémie. Il devrait fonctionner sans soucis maintenant (bien qu’il fonctionnait sans soucis auparavant non plus). Pamputt [Discuter] 10 mai 2013 à 18:59 (UTC)

langues salish [modifier]

Bonjour Verdy_p, je viens d’annuler ton renommage de « langues salish » en « langues salishiennes ». A priori, je ne suis pas opposé à ce renommage mais comme d’habitude tu effectues ce genre de modifications sans discussion préalable ce qui n’est pas la méthode couramment employée sur le Wiktionnaire. Bref, la question est ici de savoir si « langues salishiennes » est plus répandue que « langues salish », si un francophone étant intéressé par cette langue est plus susceptible de rechercher l’un ou l’autre. J’ai vu les liens que tu as donné mais le terme « langues salish » semble également relativement courant. Pamputt [Discuter] 10 mai 2013 à 18:54 (UTC)