Les sociolinguistes ont établi une classification qui comprend trois grandes catégories. Les langues abstand sont celles qui se sont suffisamment différenciées les unes des autres pour ne plus être considérées comme des formes dialectales d’une autre langue. Les langues-toit sont celles par lesquelles les locuteurs de dialectes très différenciés doivent passer pour se comprendre : c’est le cas de l’arabe littéral, de l’italien et de l’allemand standard ou encore du néerlandais standard (pour le hollandais, le flamand occidental, le limbourgeois et le bas-allemand des Pays-Bas). Enfin les langues ausbau (« par élaboration ») sont des variantes d’une langue qui ont été érigées en langues distinctes, le plus souvent pour des motifs de construction d’une identité nationale (avec parfois un alphabet différent) : c’est le cas du danois et du norvégien bokmål, du néerlandais et de l’afrikaans, du tchèque et du slovaque, du thaï et du lao, de l’hindi et de l’ourdou, des différentes variétés du « serbo-croate », du dari afghan et du persan, du rusyn (ruthène) et de l’ukrainien, du roumain et du moldave, du bulgare et du macédonien, du malais et du bahasa indonesia…
Environ 7 100 langues, classées en quelque quatre cents familles, sont parlées dans le monde. Les plus importantes sont les 455 langues indo-européennes, parlées par environ 40 % de la population mondiale, et les 462 langues sino-tibétaines (ou trans-himalayennes, langues chinoises et tibéto-birmanes) pratiquées par environ 20 % des habitants de la planète. Ces deux groupes devancent, de très loin, les familles nigéro-congolaise, afro-asiatique (ou chamito-sémitique), austronésienne, bantoue, dravidienne, altaïque et japonique qui, à elles sept, représentent environ 25 % des Terriens. Si 3 000 langues sont en voie de disparition, 200 sont à l’inverse parlées par près de 90 % de la population mondiale. Les premières sont l’anglais (1,5 milliard de locuteurs, mais moins de 400 millions l’ayant pour langue maternelle) et le mandarin chinois (plus de 1,2 milliard de locuteurs, dont un milliard comme langue maternelle). Suivent l’hindi (respectivement plus de 600 et près de 350 millions), l’espagnol (560 et 480 millions), l’arabe standard (plus de 330), le français (plus de 310), le bengali (plus de 280), le portugais (près de 270) le russe et l’indonésien (plus de 250) et l’ourdou (moins de 250). Les langues suivantes (allemand standard, japonais, pidgin nigérian, arabe égyptien…) réunissent moins de 140 millions de locuteurs. Source (2024) : https://www.ethnologue.com/insights/most-spoken-language/
La plupart des pays possèdent au moins une langue officielle (comme le français en France) et beaucoup en comptent même plusieurs (le record appartenant à la Bolivie avec trente-sept parlers reconnus par la Constitution). S’y ajoute le fait que, dans certains pays, des langues régionales peuvent être reconnues localement comme officielles, aux côtés de la langue nationale (cf. Exemples dans Particularismes socio-culturels). A l’inverse, certains pays n’ont pas de langue établie constitutionnellement, mais des langues qui jouent ce rôle de facto : l’anglais au Royaume-Uni et en Australie, l’espagnol au Mexique et en Argentine… Plusieurs pays peuvent avoir la même langue comme langue officielle : l’anglais est celle d’une cinquantaine d’États indépendants, le français, l’arabe et l’espagnol celles d’une vingtaine.