La televisión es la primera escuela del niño, en donde se educa con base en imágenes que le enseñan que lo que ve es lo único que cuenta. Así, la función simbólica de la palabra queda relegada frente a la representación visual . El niño aprende de la televisión antes que de los libros: se forma viendo y ya no lee. Dicha formación va atrofiando su capacidad para comprender, pues su mente crece ajena al concepto que se forma y desarrolla mediante la cultura escrita y el lenguaje verbal.
Dejando a un lado la función de entretenimiento que la televisión tiene, Sartori se concentra en su labor formativa. No es el homo ludens el que le interesa, sino el homo videns. Si el niño crece junto al televisor, su concepción del mundo se vuelve una caricatura; conoce la realidad por medio de sus imágenes y la reduce a éstas. Su capacidad de administrar los acontecimientos que lo rodean está condicionada a lo visible: su capacidad de abstracción (de trascender, por decirlo de algún modo, lo que le dicta el ojo) es sumamente pobre, "no sólo en cuanto a palabras, sino sobre todo en cuanto a la riqueza de significado". La imagen no tiene contenido cognoscitivo, es prácticamente ininteligible. El acto de ver anula, en este caso, el de pensar. El concepto queda sumergido entre colores, formas, secuencias y ruidos de fondo. En tanto que la asimilación de una palabra requiere del conocimiento de un lenguaje y de una lengua, la imagen, por su parte, se procesa automáticamente: se ve, y con eso es suficiente.
En el mundo del homo videns no hay más autoridad que la de la pantalla: el individuo sólo cree en lo que ve (o en lo que cree ver). Sin embargo, la imagen también miente; puede falsear los hechos con la misma facilidad que cualquier otro medio de comunicación, con la diferencia de que, "la fuerza de la veracidad inherente a la imagen hace la mentira más eficaz y, por tanto, más peligrosa".