ESTADÍSTICA ESTRUCTURAL DE EMPRESAS: SECTOR INDUSTRIAL
RESULTADOS PARA LA COMUNITAT VALENCIANA

NOTAS METODOLÓGICAS



1. Introducción

Las estadísticas estructurales de empresas (EEE) tienen como fin proporcionar información sobre las principales características estructurales y económicas de las empresas. El Instituto Nacional de Estadística (INE) elabora anualmente estas estadísticas para los sectores de Industria, Comercio y Servicios, las cuales se rigen por el Reglamento 295/2008 del Parlamento y del Consejo de la Unión Europea sobre las estadísticas estructurales de empresas.

Las EEE presentan un desglose por comunidades autónomas para ciertas variables (número de locales, cifra de negocios, sueldos y salarios, inversión en activos materiales y personal ocupado) considerando la ubicación de los establecimientos o locales que las empresas tengan en diferentes emplazamientos geográficos. Para obtener esta distribución se requiere a las unidades informantes que desglosen las variables anteriormente citadas según donde se encuentran los establecimientos desde los que se realiza la actividad económica.

El Instituto Valenciano de Estadística (IVE), a partir de los microdatos facilitados por el INE, elabora la Estadística Estructural de Empresas: Sector Industrial, Resultados para la Comunitat Valenciana.

Con la publicación de la estadística estructural de empresas: resultados para la Comunitat Valenciana 2019 se proporciona información complementaria a la proporcionada por el INE para la Comunitat Valenciana. Por una parte, se ofrece información sobre un conjunto más amplio de clasificaciones que sirven para establecer tipologías más concretas y, mediante la utilización de clasificaciones propias, más adaptadas al tejido productivo de la Comunitat Valenciana, que son coherentes con otras operaciones del IVE que investigan el sector industrial.

Por otra parte, se aportan resultados sobre un conjunto de variables mucho más extenso del considerado por el INE tanto para las empresas con sede en la Comunitat Valenciana, como para los establecimientos o locales ubicados en la misma. En este último caso, los resultados se basan en una metodología de estimación cuyas características se exponen en el segundo apartado de este documento.

1.1 Breve descripción cronológica de las principales variaciones de las EEE

Hasta el año 2014, el INE elaboraba las encuestas estructurales de empresas mediante procesos y calendarios separados según el sector estudiado (Encuesta Industrial de Empresas, Encuesta Anual de Comercio y Encuesta Anual de Servicios). En 2015 comenzó la ejecución del Proyecto de integración de las encuestas económicas estructurales que ha supuesto una reforma de las tres encuestas mencionadas en los siguientes aspectos:

1. Cuestionarios prácticamente uniformes para los tres sectores y adaptados, en el caso de las empresas personas jurídicas, a los modelos normalizados de las Cuentas Anuales.
2. Homogeneización del plan de difusión de resultados que facilita la comparación de los tres sectores.

A partir del ejercicio de referencia 2016, la EEE ha experimentado una serie de mejoras:

1. Diseños muestrales más eficientes cuyos objetivos son reducir la carga de los informantes y mejorar el aprovechamiento de los registros administrativos.
2. Mejoras metodológicas relacionadas con el tratamiento de las empresas que causan alta o baja de la población objetivo durante el año de referencia, así como la imputación de la falta de respuesta y con la estimación de las variables relativas al empleo utilizando para ello fuentes administrativas.

Debido a las mejoras metodológicas implementadas para el ejercicio de referencia EEE-2016, la evolución reflejada en relación a años anteriores obedece no solo a posibles cambios reales producidos en dicho período sino también al efecto de las mejoras mencionadas.

El INE informó sobre la incidencia que los cambios introducidos en 2016 tuvieron en los resultados mediante el documento titulado "Medida del efecto de los cambios metodológicos en las Estadísticas Estructurales de Empresas 2016".

El ejercicio 2017 incorporó ciertas mejoras o cambios menores que permiten hablar de continuidad respecto al año anterior en la producción de estas estadísticas estructurales integradas.

A partir del año de referencia 2018 se introduce una novedad relevante en la definición de empresa a efectos estadísticos. Hasta el año 2017 se había identificado empresa con unidad legal, pero en adelante surge el concepto de "empresa estadística" con el fin de reflejar en las estadísticas oficiales la creciente complejidad en la forma interna de operar de los grupos empresariales. Efectivamente, las unidades legales que forman parte de un grupo empresarial, a veces, venden sus productos o prestan sus servicios exclusiva o principalmente al interior del grupo, sin estar orientadas al mercado ni tener poder de decisión sobre el conjunto del proceso productivo. El enfoque basado en la "empresa estadística" es por tanto implementado por primera vez en la estadística estructural de empresa con año de referencia 2018.

Este cambio no afecta a la explotación de los datos relativos a la Comunitat Valenciana que sigue ofreciendo resultados sobre las unidades legales con sede en la Comunitat Valenciana por una parte y, por otra, sobre los establecimientos ubicados en ella. Por ello, en lo que sigue, los términos empresa y unidad legal se utilizan de manera indistinta para hacer referencia al mismo concepto.

Para profundizar en los aspectos metodológicos y definiciones de esta operación puede recurrirse a la metodología publicada por el INE, que expone, de forma conjunta y uniforme para los tres sectores de estudio, las principales líneas metodológicas, sus conceptos y definiciones. No obstante, a continuación, se hace referencia a los más importantes.


2. Principales características metodológicas


2.1 Ámbito territorial, sectorial y temporal

La unidad estadística básica de esta operación es la "Empresa Estadística" definida en los términos indicados en el punto anterior, aunque la información básica se obtiene a partir de las Unidades Legales (unidades informantes) que, al disponer de los datos contables y de empleo, proporciónan información homogénea. La información sobre una Empresa Estadística concreta se construye a partir de la proporcionada por las Unidades Legales que la conforman mediante la metodología Profiling o delineación de Empresas.

La población a la que se dirige la Estadística estructural de empresas (EEE) en los distintos sectores es la siguiente:

Sectores Secciones de la CNAE-2009 Divisiones
Sector industrial B. Industrias extractivas 05-09
C. Industria manufacturera 10-33
D. Suministro de energía eléctrica, gas vapor y aire acondicionado 35
E. Suministro de agua, actividades de saneamiento, gestión de residuos y descontaminación 36-39
Sector comercio G. Comercio al por mayor y al por menor, reparación de vehículos de motor y motocicletas 45-47
Sector servicios H. Transporte y almacenamiento 49-53
I. Hostelería 55-56
J. Información y comunicaciones 58-63
L. Actividades inmobiliarias 68
M. Actividades profesionales, científicas y técnicas 69-75
N. Actividades administrativas y servicios auxiliares 77-82
R. Actividades artísticas, recreativas y de entretenimiento 90-93
S. Otros servicios 95-96

La EEE se realiza con periodicidad anual, siendo el período de referencia de los datos, con carácter general, el año natural. La excepción la constituyen las empresas que funcionan por temporadas o campañas que comprenden varios años y contabilicen sus datos con esta premisa. Estas empresas proporcionan la información de la temporada o campaña que terminó en el año de referencia de la encuesta.

2.2 Diseño muestral

La muestra de empresas-unidades legales se obtiene utilizando como marco el Directorio Central de Empresas (DIRCE) mediante muestreo aleatorio estratificado y el establecimiento de una parte exhaustiva en la muestra formada por unidades relevantes de acuerdo con determinados criterios: las Unidades Legales con 50 o más asalariados, las unidades más relevantes por asalariados o por cifra de negocios dadas de alta en el marco en el mismo año de referencia, filiales en España de empresas extranjeras y las unidades con menos de 50 asalariados, pero con grandes cifras de negocios. Además, se incorporan como unidades exhaustivas otras Unidades Legales necesarias para elaborar la información a nivel nacional en términos de la Empresa Estadística. A la muestra de Empresas Estadísticas se llega mediante muestreo indirecto.

Los estratos se forman por el cruce de varias variables: comunidad autónoma, actividad económica principal, grupos de tamaño, según el número de personas asalariadas, cifra de negocios y naturaleza jurídica aunque esta última solo interviene en el caso de los sectores de servicios y comercio. Estas variables se combinan de diferente manera en función del sector investigado.

En general, dentro de cada estrato, se calcula el tamaño muestral mediante afijación óptima. La muestra se obtiene mediante selección aleatoria usando técnicas de coordinación negativa, a fin de reducir el número de encuestas que una empresa del DIRCE realiza a lo largo del año.

2.3 Estimación

Los datos muestrales que sirven como punto de partida en esta operación contienen información sobre el conjunto de empresas o unidades legales que tienen sede en la Comunitat Valenciana y también sobre el conjunto de locales ubicados en la Comunitat con independencia de donde esté la sede de la empresa a la que pertenecen.

La información muestral proporcionada sobre las empresas con sede en la Comunitat está formada por un conjunto extenso de variables que permite obtener una visión amplia de su desempeño. Sin embargo, la información disponible sobre los locales consiste en un conjunto de cuatro variables denominadas variables regionalizadas: cifra de negocios, número medio de ocupados, sueldos y salarios e inversión en activos materiales. En el sector industrial las empresas que forma la muestra deben especificar las anteriores variables en cada uno de los locales en los que desarrollan su actividad, si es que tienen más de una. En el caso de los sectores servicios y comercio, esas variables se especifican por comunidad autónoma, es decir, se proporciona para cada comunidad autónoma el agregado correspondiente a todos los locales de la empresa que operan en ella.

El IVE publica desde 2015 las encuestas estructurales bajo un doble enfoque. Por una parte, se generan resultados sobre las empresas con sede social en la Comunitat y, por otra, de los locales ubicados en la misma. Hasta el año de referencia 2018 los resultados publicados sobre los dos ámbitos mencionados se basaban fundamentalmente en las principales variables comunes en los dos. A partir del año de referencia 2019, la publicación de las encuestas estructurales proporciona la estimación de un número mucho más amplio de variables tanto de las empresas como de los locales ubicados en la Comunitat organizadas en seis bloques:

Los resultados sobre las empresas con sede en la Comunitat Valenciana son obtenidos mediante estimadores de expansión simple, ajustados por la falta de respuesta y los cambios de estrato. Así, el estimador del total de la variable Y para un estrato h viene dado por la siguiente expresión:

\(\hat{Y} _{h} = \hat{F}_{h}{\sum\limits_{i=1}^{n^e_h}{y_{hi}}} \)

Donde \(\hat{F}_h\) es el factor de elevación estimado en el estrato h

\(n_h^e\) es el número de empresas muestrales que responden o se imputan en el estrato h

\(y_{hi}\) es el valor que toma la variable Y en la empresa i del estrato h.


El estimador del total \(\hat{Y} _{m} \) para un dominio 'm' cualquiera (subgrupos de la población que no tienen por qué coincidir con los estratos ni con la unión de algunos de ellos) es la suma de los totales estimados para el dominio dentro de cada estrato, es decir:

\(\hat{Y} _{m} = \sum\limits_{h}\hat{F}_{h}{\sum\limits_{i=1}^{n_h^e}{y_{hi}Z_{mhi}} } \)

Donde \(\hat{F}_{h}\) es el factor de elevación final asociado al estrato h

\(Z_{mhi}\) es una variable indicadora que toma el valor 1 si la empresa pertenece al dominio m y 0 en caso contrario.

Los resultados de los locales ubicados en la Comunitat se obtienen de forma análoga a la anterior cuando se proporciona la información relativa a las variables disponibles por local o variables regionalizas, es decir, cuando se estima el número de locales, la cifra de negocios generada por los mismos, el personal medio de ocupados, sus sueldos y salarios o la inversión material. Para proporcionar estimaciones del conjunto ampliado de variables en el ámbito de los locales se ha recurrido a una metodología propia cuyo fundamento se expone a continuación.

2.4 Estimación regionalizada del conjunto ampliado de variables

La metodología incorporada por el IVE en esta operación consta de dos fases. En la primera de ellas, se calcula un factor de tamaño o de escala que, aplicado a cualquier variable medida en una empresa multilocalizada, proporciona una estimación preliminar del valor de dicha variable en la parte de la empresa ubicada dentro de la Comunitat desarrollada por uno o varios de sus locales. Para construir el factor de tamaño se ha utilizado el procedimiento de las componentes principales utilizando como variables explicativas las variables disponibles en la muestra de locales y utilizando la norma L1. Los cálculos se han realizado mediante el paquete "pcaL1"(1) de R(3). El factor de tamaño de un local dado ha sido calculado como el cociente del valor de la primera componente principal en el local respecto a su valor en la empresa a la que pertenece. La contribución de un local a la estimación del total de una variable se obtendrá como el valor que dicha variable toma en la empresa de la que forma parte, multiplicado por el factor de tamaño y por el factor de elevación inicial. De esta manera, se construye un nuevo factor de elevación inicial que se aplica no al valor que la variable toma en el local, sino al valor de dicha variable en la empresa a la cual pertenece.

La segunda fase consiste en un calibrado de la muestra de locales a partir del concepto de estimación de regresión generalizada (GREG) que usa como variables auxiliares las variables disponibles dicha muestra. Para una descripción del método, puede consultarse el artículo "Methodological Principles for a Generalized Estimation System at Statistics Canada"(2) la cual permite pasar de los factores de elevación de la muestra, que, en nuestro caso, han sido adaptados como producto del factor de elevación inicial y el factor de tamaño, a unos nuevos factores de elevación o g-factores que mejoran la coherencia de las estimaciones ya que reproducen los totales de las variables auxiliares en determinadas tipologías de actividad relevantes tanto en el muestreo como en la explotación de resultados. Los nuevos factores de elevación, a los que se hará referencia como 'factores de regionalización', obtenidos permiten calcular estimaciones relativas a la población de locales en la Comunitat sobre variables que no han sido proporcionadas en su muestra, ya que dichos factores se aplican a los valores de esas variables registrados en las empresas correspondientes.

El nuevo calibrado solo se aplica a la muestra de locales ubicados en la Comunitat que pertenecen a empresas multilocalizadas. De esta manera, los locales de las empresas unilocalizadas heredan las variables disponibles a nivel de empresa y contribuyen a la estimación de dichas variables con sus factores de elevación muestrales originales. En la implementación de este método se ha seleccionado como clasificación de referencia las divisiones de la CNAE-19. A este nivel, el nuevo sistema de factores de elevación reproduce los totales de las variables regionalizadas proporcionadas en la muestra de locales, salvo problemas de multicolinealidad detectados en determinadas divisiones de actividad los cuales generan diferencias leves con los totales estimados mediante los factores de elevación originales. Debido a esta característica del método, los resultados proporcionados para los locales ubicados en la Comunitat Valenciana, excepto los principales resultados, se basan exclusivamente en la clasificación según división de la CNAE-09.

Por otra parte, debido a la naturaleza del método utilizado, en unos pocos casos se generan factores de tamaño con valores extremos muy diferentes de los factores generados en la primera fase. Esta situación ha provocado, en un pequeño número de casos, estimaciones incoherentes en determinadas variables y sectores que lógicamente no se proporcionan en la explotación de resultados.

Con esta metodología se ha ampliado la explotación realizada hasta ahora en la serie de encuestas estructurales disponibles, ello sin perjuicio de futuras revisiones que eventualmente puedan mejorar la calidad o cantidad de los resultados ofrecidos.

2.5 Cálculo de errores

La explotación de la Encuesta estructural de empresas incluye el cálculo de errores muestrales en la estimación de las variables que forman parte de los principales resultados, tanto si los resultados son de los locales ubicados en la Comunitat como si son de las empresas con sede en la misma. En el primer caso se proporcionan coeficientes de variación según la sectorización propia especificada en ésta metodología y, en el segundo, se proporcionan los errores muestrales obtenidos tanto en la clasificación según sección y división de la CNAE-2009, como en la sectorización propia antes mencionada.

Los errores muestrales publicados hasta el año de referencia 2016 fueron calculados mediante la fórmula de Raulin. A partir del año de referencia 2017, los errores muestrales incluidos en esta publicación son obtenidos mediante linealización de Taylor y, para ello, se utiliza el paquete "survey"(4) de R(3).

(1) Sapan Jot, J. Paul Brooks, Andrea Visentin, Young Woong Park (2020). "pcaL1: L1-Norm PCA Methods". R package version 1.5.4.

(2) "Methodological Principles for a Generalized Estimation System at Statistics Canada". V. Estevao, M.A. Hidiroglou, and C.E. Särndal. Journal of Official Statistics, Vol. 11. No.2, 1995, pp. 181-204

(3) R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

(4) T. Lumley (2018) "survey: analysis of complex survey samples". R package version 3.35.

3. Variables

Las principales variables de la encuesta pueden agruparse en variables de clasificación y de estudio. Las variables de clasificación son:

Las principales variables objeto de estudio y publicación por el IVE son:


4. Tabulación de resultados

El IVE ofrece una explotación de resultados organizada en dos apartados:

En el primer apartado se proporcionan tabulaciones de un conjunto amplio de variables sobre las empresas con sede en la Comunitat. Los resultados proporcionados sobre los locales son más reducidos ya que se basan en las variables disponibles por local o variables regionalizadas obtenidas mediante el cuestionario. En ambos casos, los resultados se ofrecen según distintas tipologías de empresas y establecimientos basadas en la actividad que desarrollan, en su condición jurídica o en el tamaño (en personal ocupado o cifra de negocios). Las clasificaciones en función de la actividad consisten en dos sectorizaciones de elaboración propia basadas en la CNAE-2009 y otras que pueden considerarse estándar como las divisiones y secciones de la propia CNAE-09, la basada en el destino económico de los bienes o la basada en el nivel tecnológico de la actividad.

La estructura de este apartado es:

El segundo apartado contiene la estimación regionalizada según el procedimiento descrito en el punto 2.4 de distintas variables económicas y de personal sobre los locales situados en la Comunitat Valenciana. Los resultados son proporcionados por división y sección de actividad de la CNAE-09 y están organizados como sigue:

Con esta tabulación se pretende proporcionar información complementaria a la proporcionada por el INE sobre establecimientos ubicados en la Comunitat Valenciana y consistente en la tabulación a nivel de división de la CNAE-09 de las cinco variables regionalizadas proporcionadas en la muestra de establecimientos.

Las agrupaciones y sectores de actividad a los que hacen referencia las tablas aludidas son los que se muestran a continuación:

AGRUPACIONES SECTORES CNAE-09
DENOMINACIÓN DENOMINACIÓN
1 Extractivas y refino; energía, agua y residuos 1 Refino; energía y agua 19, 35, 36
2 Extractivas 05, 06, 07, 08, 09
2 Alimentación, bebidas y tabaco 3 Cárnicas 101
4 Pesqueras y conserveras de frutas y hortalizas 102-103
5 Lácteas 105
6 Molinería, panadería y pastas alimenticias 106-107
7 Otros productos alimenticios 104, 108, 109
8 Bebidas y tabaco 11, 12
3 Industria textil y de la confección 9 Fibras, hilos y tejidos 131, 132
10 Acabados textiles 133
11 Otras industrias textiles 139
12 Confección de prendas de vestir 14
4 Industria del cuero y del calzado 13 Curtido y artículos en cuero 151
14 Calzado 152
5 Madera 15 Madera 16
6 Papel y cartón; artes gráficas 16 Papel y cartón 17
17 Artes gráficas 18
7 Química y productos farmacéuticos 18 Química y productos farmacéuticos 20, 21
8 Caucho y plástico 19 Caucho y plástico 22
9 Productos minerales no metálicos 20 Vidrio 231
21 Productos cerámicos 232, 234
22 Azulejos 2331
23 Materiales de construcción 2332, 235, 236
24 Otros productos minerales no metalúrgicos 237, 239
10 Metalurgia y productos metálicos 25 Metalurgia 24
26 Productos metálicos 25
11 Material y equipo eléctrico, electrónico, informático y óptico 27 Productos informáticos, electrónicos y ópticos 26
28 Material y equipo eléctrico 27
12 Maquinaria y equipo 29 Maquinaria y equipo 28
13 Material de transporte 30 Vehículos de motor y sus componentes 29
31 Otro material de transporte 30
14 Manufacturas diversas; reparación e instalación de maquinaria y equipo 32 Muebles 31
33 Juegos y juguetes 324
34 Manufacturas diversas 321, 322, 323, 325, 329
35 Reparación e instalación de maquinaria y equipo 33
1 Extractivas y refino; energía, agua y residuos 36 Saneamiento, gestión de residuos y descontaminación 37, 38, 39