La ciencia de datos ambientales - los recursos naturales

Puede utilizar la ciencia de datos para modelar los recursos naturales en su forma cruda. Este tipo de ciencia de datos del medio ambiente en general, implica algunos modelos estadísticos avanzados para comprender mejor los recursos naturales. Modelar los recursos al natural - condiciones del agua, aire y tierra a medida que se producen en la naturaleza - para comprender mejor los efectos ecológicos del entorno natural de la vida humana.

Exploración de modelado de recursos naturales

la ciencia de datos ambientales puede modelar los recursos naturales de la materia prima para que pueda entender mejor los procesos ambientales con el fin de comprender cómo estos procesos afectan a la vida en la Tierra. Después de los procesos ambientales se entienden claramente, entonces y sólo entonces pueden ingenieros ambientales paso en el diseño de sistemas para resolver problemas que estos procesos naturales puede estar creando. La siguiente lista describe los tipos de problemas de recursos naturales que la ciencia de datos ambientales puede modelar y predecir:

  • Los problemas del agua: tasas de precipitación, patrones geohidrológicas, los flujos de aguas subterráneas y aguas subterráneas concentraciones de toxina
  • problemas del aire: La concentración y la dispersión de los niveles de partículas de materia y las concentraciones de gases de efecto invernadero
  • problemas de la tierra: la migración del suelo contaminante y geomorfología, así como la geofísica, la exploración mineral, y exploración de petróleo y gas

Si su objetivo es construir un modelo predictivo que puede utilizar para ayudarle a entender mejor los procesos naturales del medio ambiente, se puede utilizar el modelado de recursos naturales para ayudarle. No espere que el modelado de los recursos naturales a ser fácil, sin embargo. Las estadísticas que intervienen en este tipo de modelos pueden ser increíblemente compleja.

Incursionando en la ciencia de datos

Debido a los procesos y sistemas ambientales implican muchos diferentes variables interdependientes, la mayoría de modelos de recursos naturales requiere el uso de algoritmos estadísticos muy complejos. La siguiente lista muestra algunos elementos de la ciencia de datos que comúnmente se desplegó en el modelado de los recursos naturales:

  • Estadísticas, matemáticas y aprendizaje automático: inferencia bayesiana, multinivel inferencia bayesiana jerárquico, el análisis espectral multitaper, cópulas, Wavelet autorregresivo Método (caliente), autorregresivos de promedios móviles (Armas), simulaciones de Monte Carlo, de regresión aditivo estructurado modelos (STAR), regresión sobre estadísticas de orden (ROS), de máxima verosimilitud estimaciones (MLEs), expectativa de maximización (EM), lineal y reducción de la dimensión no lineal, análisis de wavelets, los métodos de dominio de frecuencia, cadenas de Markov, vecino k-más cercano (kNN), la densidad del núcleo, y estimación de la densidad logspline, entre otros métodos
  • La estadística espacial: En general, algo así como el mapeo probabilístico
  • Visualización de datos: Al igual que en otras áreas de la ciencia, los datos necesarios para el análisis exploratorio y para comunicar los resultados con los demás
  • Web-raspado: Muchas veces, cuando se requiere la recopilación de datos para los modelos ambientales
  • La tecnología SIG: Análisis espacial y cartografía
  • Codificación requisitos: Al utilizar Python, R, SPSS, SAS, MATLAB, Fortran, y SQL, entre otros lenguajes de programación

Modelado de los recursos naturales para resolver los problemas ambientales

El trabajo de Centro del Agua de ColumbiaDirector ‘s, el Dr. Upmanu Lall, proporciona un ejemplo de clase mundial de utilizar la ciencia de datos ambientales para resolver problemas increíblemente complejos de recursos hídricos. El Dr. Lall utiliza estadísticas avanzadas, matemáticas, codificación, y una experiencia en el tema de escalonamiento en ingeniería ambiental para descubrir relaciones complejas e interdependientes entre las características globales de los recursos hídricos, los productos internos brutos (PIB) nacional, la pobreza y las tasas nacionales de consumo de energía.

En uno de los proyectos más recientes del Dr. Lall, se encontró que en los países con la variabilidad alta precipitación - países que experimentan sequías extremas seguido de una inundación masiva - los resultados de inestabilidad en la falta de recursos hídricos estables para el desarrollo agrícola, más escorrentía y la erosión, y la disminución general en el PIB de esa nación. La inversa también es cierto, en que los países que tienen tasas de precipitación, moderados estables tienen un mejor suministro de los recursos hídricos para el desarrollo agrícola, la mejora de las condiciones ambientales en general, y de los PIB promedio más altos. Por lo tanto, el uso de la ciencia de datos ambientales, el Dr. Lall ha sido capaz de establecer una correlación entre las tendencias fuertes precipitaciones de una nación y sus tasas de pobreza.

Video: Big Data no es una ciencia a menos que uses bata de laboratorio | Devotion 005

Con respecto a las tecnologías y metodologías de las ciencias de datos, el Dr. Lall implementa estas herramientas:

  • programación estadística: arsenal del Dr. Lall incluye modelos multinivel jerárquico bayesiano, análisis espectral multitaper, cópulas, Wavelet autorregresivo de promedios móviles (se calienta), autorregresivos Promedio Móvil (Armas), y simulaciones Monte Carlo.
  • La programación matemática: Herramientas aquí incluyen la reducción lineal y no lineal dimensión, análisis de wavelets, los métodos de dominio de frecuencia, y los modelos ocultos de Markov no homogéneas.
  • La agrupación de análisis: En este caso, el Dr. Lall se basa en los métodos probados y verdaderos, incluyendo k-vecino más cercano, la densidad del núcleo, y la estimación de la densidad logspline.
  • Aprendizaje automático: A continuación, el Dr. Lall se centra en la incorporación de mínima varianza.
Artículos Relacionados