ARBOLES DE CLASIFICACION CON FACTOR DE PONDERACION APLICADO AL ESTUDIO DEL CONSUMO DE TABACO EN JOVENES DE LA REGION METROPOLITANA, CHILE
Resumen
El objetivo del trabajo es describir el perfil de los estudiantes de la Región Metropolitana (R.M.) que han fumado cigarrillo o han consumido algún producto tabaco en el último mes, utilizando árboles de clasificación con factor de ponderación, sobre la base de datos de la Encuesta de Tabaquismo en Jóvenes 2000 (EMTAJOVEN, Marzo 2000, OMS, MINSAL). La muestra fue de 3150 estudiantes de 12 a 15 años. Además del factor de ponderación se utilizaron 26 variables categóricas, relacionadas a
características personales y del consumo de tabaco. Se especificaron iguales probabilidades a priori y los costos de mala clasificación fueron 1, 1.5, 2, 2.5 y 3.0. Para la validación se utilizó una muestra de prueba y se docimaron las tasas de especificidad, sensibilidad y clasificación correcta sobre las muestras expandidas de construcción y validación de 13 árboles diferentes. El árbol de clasificación final determinó ocho variables para describir distintos grupos de estudiantes con una tasa de especificidad de 80% y una sensibilidad de 89 %. Las variables importantes están relacionadas a características personales, lugar donde fuma, intención de fumar, exposición al humo de tabaco, creer que el cigarrillo light es menos malo y que los adolescentes que fuman tienen más o menos amigos.
ABSTRACT
The objective of this paper is to describe the profile of the Region Metropolitana’s (RM) students that have smoked cigarettes or that have consumed some kind or tobacco during the last month. Classification Trees with Weight factor are used, using the database of the Tobacco Consumption Inquiry by Youngs 2000 (EMTAJOVEN, March 2000, OMS, MINSAL). The sample consisted in 3150 students between 12 and 15 years old. 26 categorical variables, related with personal characteristics and the consumption of tobacco were measured and the weight factor. Equal a priori probabilities were specified and the incorrect classification costs were 1, 1.5, 2, 2.5 ad 3.0. For validating, a test sampling was used and the specificity, sensitivity and correct classification rates were tested on the construction and validation of 13 different trees the expanded samples. The final classification tree determined 8 variables for describing the different student groups with a specificity rate of 80% and a sensitivity of 89%. The important variables are related with personal characteristics, place where he/she smokes, intention of smoking, exposition to tobacco’s smoke, the believe that to smoke light cigarettes is less dangerous and that smoker adolescents have more or less friends.
Key words: classification trees, testing, classification rates.
Texto completo:
Sin títuloEnlaces refback
- No hay ningún enlace refback.











