Cuando hacer el predictor

Cómo hacer una predicción en twitch

Supongamos que tengo un conjunto de datos al que he estimado una relación utilizando una regresión no paramétrica, concretamente Kernel (obviamente en este ejemplo hipotético es probable que esté ligeramente sobreajustado). El conjunto de datos va de x = 0 a x = 4. ¿Cómo puedo extrapolar y encontrar el valor y para, por ejemplo, x = 4,2?

La razón por la que quiero hacer esto, es porque quiero calcular LOOCV – que implica omitir cada punto de datos a su vez, y no estoy claro en lo que hacer cuando omitir el primer último o punto de datos en un rango.

No se puede. Los modelos de aprendizaje automático, en términos generales, aprenden a interpolar entre los puntos de datos. Aquí estás tratando de extrapolar, la extrapolación es difícil y puede ir fácilmente mal. Si utilizas un modelo sencillo, por ejemplo, de regresión lineal, es fácil extrapolar y es bastante fácil evaluar lo mal que puede salir el resultado. Si se utiliza un modelo más complicado, por ejemplo una regresión polinómica, entonces, como en el extracto del cómic de xkcd publicado más abajo, el resultado puede ser arbitrariamente malo.

Los modelos como el bosque aleatorio o la regresión kernel sólo pueden interpolar entre los puntos de datos. Para extrapolar más allá de los datos, podrías hacer algo como usar la última pendiente vista (como hiciste en el gráfico adjunto a la pregunta), o simplemente usar la predicción para el último punto conocido (x=4) como predicciones para todo lo anterior. Estos métodos sencillos de extrapolación se utilizan habitualmente para las series temporales y pueden ser preferibles si no se tienen muchos datos. Ambas soluciones son bastante arbitrarias y no hay una buena respuesta.

Cómo hacer una predicción en ciencia

Disculpa si esta pregunta no tiene mucho sentido y si es demasiado larga. Tuve algo de formación básica en estadística en la universidad, pero hay muchas lagunas en mis conocimientos que poco a poco he ido tratando de llenar, pero me he metido en un poco de lío cuando se trata de la selección de modelos, específicamente en este caso sobre cómo elegir entre una serie de modelos de regresión logística y si la validación cruzada es necesaria para los modelos de regresión logística no predictivos.

He estado eligiendo un modelo teniendo en cuenta las puntuaciones AIC y BIC. Leí que juzgar los modelos basándose en las puntuaciones AIC era lo mejor para utilizar esos modelos para hacer predicciones, y que las puntuaciones BIC eran mejores para elegir modelos «más verdaderos» basados en los datos utilizados para ajustar el modelo. Pensé que había desarrollado un modelo relativamente bueno basado en este enfoque, pero ahora no estoy muy seguro.

Mi supervisor realizó otro modelo utilizando la selección por pasos, ya que así se había hecho en investigaciones anteriores. El modelo producido tiene una puntuación BIC relativamente baja en comparación con los que he desarrollado, y una puntuación AIC relativamente alta, pero es bastante diferente en cuanto a algunas de las variables independientes que contiene. He leído que la selección por pasos no es una buena manera de seleccionar un modelo y no querría seguir este enfoque en general si es posible. Pero ahora siento que necesito justificar más los modelos que he producido y no estoy del todo seguro de cómo hacerlo.

¿qué técnica estadística se utiliza para hacer predicciones de resultados futuros a partir de los datos presentes?

Hay varias actividades que los profesores pueden incorporar en su aula y que permiten a los alumnos hacer predicciones de forma eficaz. Para introducir esta estrategia de lectura, los profesores pueden repartir fotografías de un periódico o una revista. Los alumnos harán una predicción con las pruebas de la fotografía, sus conocimientos previos o ejemplos de sus propias experiencias.    Los profesores también pueden crear un cubo de predicciones. Cuando se presenta una nueva historia, los alumnos hacen primero un recorrido con imágenes y luego hacen una predicción basada en el título, las ilustraciones y los diagramas. Esto permite a los alumnos utilizar pistas y pruebas del texto para hacer predicciones precisas. A continuación, los niños escriben sus predicciones en un papelito y las meten en el cubo. A continuación, los alumnos leen el cuento en sus pequeños grupos de lectura. Una vez terminada la historia, pueden compartir sus predicciones y hacer conexiones con las otras respuestas que se compartieron.

Los alumnos pueden hacer predicciones basadas en patrones. Al observar un problema o un ejemplo, los alumnos serán capaces de reconocer diferentes diseños/esquemas a través de la repetición y la observación. A partir de esta información, los alumnos podrán hacer una predicción con los datos que hayan recogido para confirmar su respuesta mientras justifican su razonamiento.

Ejemplo de predicción de regresión

Ayer escribí sobre cómo los expertos tienden a hacer malas predicciones porque a menudo están demasiado apegados a un resultado concreto. Y cuando están apegados a un resultado concreto, sus cerebros resuelven cada ecuación con la respuesta que quieren, no con la más probable.

George Orwell observó que la mayoría de la gente es más realista cuando hace un presupuesto doméstico que cuando hace predicciones sobre política. Podemos ampliar esto y decir que la mayoría de nosotros somos irremediablemente parciales cuando evaluamos las perspectivas de, por ejemplo, nuestros equipos deportivos favoritos o nuestras selecciones bursátiles favoritas.

3. Conozca sus prejuicios. Entiende dónde es probable que no «entiendas», o dónde es probable que racionalices la información que no quieres escuchar. (Aquí hay una lista muy útil de algunos sesgos comunes que nos impiden ver con claridad).

4. No digas a los demás lo que quieren oír. Muchos expertos pierden su credibilidad cuando hay un cierto segmento de su industria o una cierta parte del público en general que se entretiene con determinados tipos de profecías. Del mismo modo, si le dices a tus jefes o a tus colegas lo que sabes que quieren oír, acabarás arruinando tu propia credibilidad.

Esta web utiliza cookies propias para su correcto funcionamiento. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad