Desarrollo y aplicación de un modelo de sensor suave de regresión de bosque aleatorio para el tratamiento de aguas residuales domésticas en un reactor por lotes de secuenciación

Scientific Reports volumen 13, Número de artículo: 9149 (2023) Citar este artículo

17 Accesos

Detalles de métricas

Los equipos de tratamiento de agua distribuidos a pequeña escala, como el reactor secuencial por lotes (SBR), se utilizan ampliamente en el campo del tratamiento de aguas residuales domésticas rurales debido a sus ventajas de instalación y construcción rápidas, bajo costo de operación y gran adaptabilidad. Sin embargo, debido a las características de no linealidad e histéresis en el proceso SBR, es difícil construir el modelo de simulación del tratamiento de aguas residuales. En este estudio, se desarrolló una metodología utilizando inteligencia artificial y un sistema de control automático que puede ahorrar energía correspondiente a reducir las emisiones de carbono. La metodología aprovecha el modelo de bosque aleatorio para determinar un sensor blando adecuado para la predicción de las tendencias de DQO. Este estudio utiliza sensores de pH y temperatura como premisas para los sensores de DQO. En el método propuesto, los datos se preprocesaron en 12 variables de entrada y se seleccionaron las 7 variables principales como variables del modelo optimizado. Ciclo terminado por la inteligencia artificial y el sistema de control automático en lugar de por el control de tiempo fijo que era un escenario descontrolado. En 12 casos de prueba, el porcentaje de eliminación de DQO es de aproximadamente 91,075 % mientras que se ahorró 24,25 % de tiempo o energía desde una perspectiva promedio. Esta metodología de selección de sensores blandos propuesta se puede aplicar en el campo del tratamiento de aguas residuales domésticas rurales con ventajas de ahorro de tiempo y energía. El ahorro de tiempo da como resultado el aumento de la capacidad de tratamiento y el ahorro de energía representa una tecnología baja en carbono. La metodología propuesta proporciona un marco para investigar formas de reducir los costos asociados con la recopilación de datos al reemplazar sensores costosos y poco confiables con alternativas asequibles y confiables. Al adoptar este enfoque, se puede mantener la conservación de energía mientras se cumplen los estándares de emisión.

Las aguas residuales domésticas rurales se caracterizan por una calidad y cantidad de agua inestables, descargas dispersas y baja concentración de contaminantes1. Para hacer frente a estos desafíos, los equipos de tratamiento de agua distribuidos a pequeña escala se han vuelto ampliamente utilizados en el campo del tratamiento de aguas residuales domésticas rurales debido a su rápida instalación y construcción, bajo costo de operación y gran adaptabilidad2. En los últimos años, el proceso del reactor secuencial por lotes (SBR) se ha convertido en una opción prometedora para el tratamiento de aguas residuales domésticas rurales. Cuando se compara con otros procesos, el SBR puede resistir eficazmente los impactos de la carga orgánica, tiene modos de operación flexibles, produce buenos efectos de efluentes y logra mejores efectos de eliminación de nitrógeno y fósforo3,4,5,6.

Sin embargo, la construcción de modelos de simulación precisos para el tratamiento de aguas residuales domésticas rurales puede ser un desafío debido a las características de no linealidad e histéresis que presenta el proceso SBR7,8. Los problemas no lineales en el tratamiento de aguas residuales se refieren a las relaciones complejas, diversas y no lineales que surgen de las interacciones de varias reacciones químicas, reacciones biológicas y efectos físicos durante el tratamiento de aguas residuales.

La inteligencia artificial, incluido el aprendizaje automático, se ha aplicado a los procesos de tratamiento de aguas residuales para resolver de manera efectiva problemas no lineales. El aprendizaje automático abarca una variedad de métodos, como redes neuronales y regresión de vectores de soporte, que se pueden usar para analizar y modelar los datos complejos generados durante el tratamiento de aguas residuales. Esto ha mejorado efectivamente la eficiencia y la calidad del tratamiento de aguas residuales al tiempo que ha reducido los costos de tratamiento.

La red neuronal artificial (ANN) es un modelo matemático que simula el comportamiento de las redes neuronales animales y realiza un procesamiento de información distribuido y paralelo. ANN se ha vuelto ampliamente utilizada para predecir la descarga de aguas residuales, ya que puede ajustar las interconexiones entre una gran cantidad de nodos internos para procesar información compleja dentro del sistema9,10,11,12,13.

Además de utilizar métodos de redes neuronales artificiales (ANN), otras técnicas como la regresión lineal (LR), la regresión de vectores de soporte (SVR) y los métodos de redes neurodifusas también se han utilizado en la tecnología de eliminación de contaminantes para predecir cambios en las concentraciones de contaminantes o otros parámetros del proceso14,15,16,17,18,19. Estos métodos (como se muestra en la Tabla 1) han demostrado ser efectivos para modelar las relaciones complejas entre varios factores y predecir las concentraciones de contaminantes, lo que ayuda a optimizar el rendimiento del proceso de tratamiento.

Sin embargo, a pesar de que estos modelos14,15,16,17 funcionaron bastante bien, su procesamiento o entorno es idealizado. La mayoría de ellos utilizan condiciones experimentales simuladas. Una vez en un caso de ingeniería real, debido a su complejidad, el desempeño del modelo no será tan sobresaliente18,19. Además, en estos casos14,15,16,17,18,19 existen muchos tipos de datos de entrada, como OD, pH, conductividad, DBO, DQO, TN, etc., lo que aumenta la carga de trabajo o la dificultad de los datos. adquisición. Por ejemplo, hay un retraso significativo en los datos medidos de los sensores de OD; La DBO solo se puede medir con un método bioquímico y no se puede medir con precisión en línea con sensores debido a la histéresis significativa. Sin embargo, aunque la medición de DQO se puede realizar en línea, el método de medición química en línea requiere un control estricto de las condiciones de medición y la adición continua de reactivos. El método del sensor de DQO utiliza principalmente sensores ópticos, que se ven significativamente afectados por la cromaticidad y la turbidez de las aguas residuales. Además, el sensor de DQO es costoso para equipos pequeños dispersos, lo que dificulta su popularización. Por lo tanto, es necesario desarrollar sensores con una recopilación de datos estable y precisa, una vida útil prolongada y un precio económico para reemplazar los sensores con poca estabilidad, una vida útil corta y precios elevados.

Sin embargo, el algoritmo ANN tradicional se basa en la teoría asintótica, el riesgo empírico se acerca al riesgo real solo cuando el tamaño de la muestra se acerca al infinito, por lo que el tamaño de la muestra está lejos del infinito en la aplicación práctica, lo que genera problemas de capacidad de extrapolación deficiente. velocidad de convergencia lenta y extremo local20,21,22,23.

El modelo de bosque aleatorio es uno de aprendizaje automático, que se ha convertido en uno de los puntos críticos de investigación en el campo de la inteligencia artificial, que tiene una gran capacidad de aprendizaje adaptativo y capacidad de mapeo no lineal24,25. Es adecuado para la simulación del proceso de tratamiento de aguas residuales con las características de gran retraso, no linealidad y multivariable26,27.

La regresión de bosque aleatorio (RFR) es una aplicación crítica del algoritmo de bosque aleatorio (RF), que es una teoría de aprendizaje estadístico desarrollada por Breiman28. La técnica RFR implica el uso de remuestreo Bootstrap para extraer múltiples muestras de los datos originales y construir árboles de decisión para cada muestra Bootstrap. Estos árboles de decisión luego se combinan para predecir los resultados, siendo la predicción final el promedio de las predicciones generadas por todos los árboles29.

La esencia del algoritmo RFR es el modelo de árbol de decisión múltiple, que realiza predicciones al combinar árboles de decisión múltiples. El algoritmo tiene las ventajas de una alta precisión de predicción, una buena capacidad de generalización, una rápida velocidad de convergencia y menos parámetros de ajuste, lo que puede evitar efectivamente el "sobreajuste" y es adecuado para el funcionamiento de varios conjuntos de datos. Es resistente a la extracción variable de conjuntos de datos y es adecuado para espacios vectoriales variables de dimensiones ultraaltas. La RFR se ha utilizado ampliamente en muchos campos, como la medicina, la gestión y la agricultura30,31,32.

RFR también hace un uso completo de muestras limitadas y construye modelos de árboles de decisión múltiples, lo que aumenta la diversidad del árbol de decisión y mejora la precisión del modelo de integración de optimización final33,34. La Tabla 2 muestra las aplicaciones relacionadas de la regresión de bosque aleatorio.

ANN es un tipo de algoritmo de aprendizaje automático que se usa comúnmente para predecir el efecto del tratamiento de aguas residuales45,46,47,48,49. Sin embargo, una de las principales debilidades de ANN es el sobreajuste, que puede conducir a una reducción en la generalización del modelo50,51,52. Por el contrario, el modelo de regresión forestal aleatoria (RFR) es otro algoritmo de aprendizaje automático que se utiliza para predecir los efectos del tratamiento de aguas residuales. El modelo RFR tiene varias ventajas, incluida una alta precisión de predicción, una rápida eficiencia de procesamiento, una fuerte capacidad de generalización y no es fácilmente susceptible de sobreajuste53,54. Estas características hacen que el modelo RFR sea una opción atractiva para predecir los efectos del tratamiento de aguas residuales.

Los académicos utilizaron RFR para predecir la concentración de contaminantes en el aire ambiente55,56,57,58,59 y el efecto del tratamiento de aguas residuales urbanas60,61,62. Sin embargo, hay comparativamente menos estudios sobre la predicción y el control de los efectos del tratamiento de aguas residuales domésticas rurales utilizando el modelo RFR.

La metodología propuesta tiene como objetivo lograr una predicción mejorada y un control efectivo del efecto del tratamiento de las aguas residuales domésticas rurales a través del desarrollo y la utilización del modelo de sensor suave RFR. Al utilizar este enfoque, se espera establecer un modelo de sensor suave confiable y robusto que pueda monitorear y analizar con precisión los indicadores clave del tratamiento de aguas residuales en áreas rurales. Esto no solo facilitará la identificación de problemas potenciales y ayudará en su resolución, sino que también contribuirá a mejoras generales en las condiciones ecológicas locales y los estándares de salud pública.

El sensor suave es un método comúnmente utilizado en el monitoreo y control de procesos, que estima la variable de proceso de interés en función de las mediciones de otras variables que son fáciles de adquirir. El establecimiento de un modelo de sensor suave generalmente implica seleccionar variables de entrada relevantes, diseñar el modelo matemático y entrenar el modelo utilizando datos históricos. El modelo resultante se puede utilizar para la predicción y el control en tiempo real. Los sensores blandos se han aplicado ampliamente en varios procesos industriales, como procesos químicos, tratamiento de aguas residuales y plantas de energía. Las ventajas del sensor suave incluyen rentabilidad, flexibilidad y capacidad para manejar sistemas no lineales complejos. El sensor suave ha demostrado ser una herramienta valiosa para la optimización y el control de procesos63,64,65,66.

El modelo RFR es un algoritmo de integración desarrollado sobre la base de la teoría del árbol de decisión, que pertenece al tipo de embolsado67. Al combinar múltiples árboles de carritos de aprendizaje débiles y tomar el valor medio para integrar múltiples modelos, se obtiene el resultado final68.

El modelo RFR utiliza la perturbación de muestras y atributos, y aumenta la "diversidad" del árbol del carro del aprendiz débil, de modo que el resultado final de la integración tiene un alto rendimiento de precisión y generalización69. El modelo RFR resuelve problemas prácticos como muestras pequeñas, dimensiones altas y clasificación múltiple, y puede manejar tanto datos discretos como datos continuos70. Supera las deficiencias de la velocidad de convergencia lenta de las redes neuronales y requiere una gran cantidad de muestras. También resuelve el problema del ajuste excesivo o insuficiente del árbol de decisión, y tiene una buena aplicabilidad y popularización71. La Figura 1 muestra el diagrama de RFR.

Diagrama del modelo RFR.

El método de predicción general del modelo RFR es:

(1) Tomar muestras aleatoriamente de las muestras de entrenamiento (n × muestra) n veces para formar un conjunto de entrenamiento (las muestras se volvieron a colocar después de cada muestreo). Repita r veces para obtener conjuntos de entrenamiento:\(D_{1} ,D_{2} , \ldots ,D_{r}\).

(2) Para cada conjunto de entrenamiento, se seleccionan aleatoriamente k atributos del conjunto de atributos (m × atributo), \(k = \log 2m\), y luego se establecen árboles de carro:\(f_{1} (x), f_{2} (x), \ldots ,f_{r} (x)\).

(3) El valor de predicción final de Random Forest se determina mediante el método promedio:\(f(x) = \frac{1}{r}\sum\nolimits_{i = 1}^{r} {f_{i} (X)}\).

Para evaluar el rendimiento del modelo de predicción de la concentración de DQO, se seleccionan como índices de evaluación el error cuadrático medio (MSE) y el coeficiente de determinación (r2). Los indicadores se calculan de la siguiente manera:

Fórmula \(\hat{y}_{i}\) para el valor predicho del modelo, \(y_{i}\) para el valor verdadero.

Las características del modelo RFR se establecieron como la Tabla 3.

En este estudio se prepara un reactor secuencial por lotes (SBR), que recibe aguas residuales de un área residencial. La fuente de aguas residuales domésticas es de la comunidad de Shuyuan en el distrito de Pidu, Chengdu, Sichuan, China (longitud: 103,88, latitud: 30,82). El agua residual que fluía hacia el SBR comprendía aguas residuales domésticas que habían sido filtradas y precipitadas primariamente. Se diseñó y fabricó el reactor SBR (acero inoxidable, 800 mm × 800 mm × 1200 mm). El volumen de trabajo del reactor fue de 0,576 m3, respectivamente (Fig. 2). Un agitador y un dispositivo de aireación están instalados en el tanque de reacción.

Estructura de SBR.

Las aguas residuales que habían sido filtradas y precipitadas primariamente se bombearon al SBR. Esta bomba se denominó bomba A y producía 0,1856 m3 de aguas residuales alimentadas al SBR en cada ciclo. La bomba B transportó el mismo volumen de agua fuera del SBR cuando finalizó el ciclo.

El proceso SBR está automatizado y controlado por un PIC (Circuito Integrado Programable) o una computadora de un solo chip. El ciclo, que tiene una duración de 480 min, incluye las siguientes etapas: etapa de llenado y aireación de 30 min, etapa de oxidación y agitación de 330 min (alternando aireación y agitación, con una duración de 10 min de aireación y 20 min de agitación), etapa de sedimentación de 60 min y etapa de descarga de 60 min. La Figura 3 muestra la gestión del tiempo de la operación de SBR.

Proceso de tratamiento de SBR.

Se tomaron muestras de aguas residuales afluentes y efluentes del monitoreo del tanque SBR y de un recipiente de recolección que permite el paso del agua filtrada para eliminar la interferencia de lodos activados.

El pH y la temperatura filtrados se ensayaron mediante sensores de control fabricados por LuHeng Co. de China (pH:sensor de pH LuHeng 6503; temperatura:sensor de temperatura LuHeng 229).

La DQO filtrada se probó mediante el método de dicromato de potasio, el NH3-N se probó mediante el método de colorimetría con reactivo de Nessler (fotómetro visible UV SP-756P del espectro de Shanghái) y el TP se probó mediante el método de detección espectrofotométrica (fotómetro visible UV SP-756P del espectro de Shanghái). El pH y la temperatura se midieron a intervalos de 10 min mediante sensores.

Los sensores se instalaron aproximadamente 200 mm por debajo del nivel de líquido más bajo dentro del tanque de reacción y por encima de cualquier manto de lodo potencial que pudiera formarse durante la sedimentación. Todos los instrumentos fueron calibrados, mantenidos y operados de acuerdo con las instrucciones del fabricante.

Un perfil típico de DQO vio un aumento en las concentraciones a medida que el afluente se mezclaba con las aguas residuales tratadas que quedaban en el reactor del ciclo anterior. Las concentraciones de DQO alcanzaron su punto máximo poco después de la fase de llenado. Después de este pico, las concentraciones de DQO disminuyeron debido a la oxidación y nitrificación del carbono orgánico72. Aproximadamente a los 250 min, la tasa de disminución de las concentraciones de DQO no tiene cambios más evidentes y continuó así durante el resto del ciclo (Fig. 4).

Perfil típico para DQO.

Se produjo un aumento y una disminución cíclicos en el perfil de pH (Fig. 5) durante la fase de aireación, cuando el aireador se encendía y apagaba, lo que resultó en un pico y un valle en cada período de aireación en el perfil de pH. Es probable que el aumento del pH, correspondiente al período de aireación, se deba, en este caso, a la extracción de CO273. Las disminuciones en el perfil de pH durante el período de agitación de 20 min probablemente se debieron a una actividad microbiana que libera dióxido de carbono74.

Perfil típico de pH.

Como se encontró, durante la primera etapa del ciclo, el pH cayó más fuerte que en la última, probablemente porque la concentración de DQO difiere: una mayor concentración de DQO da como resultado una mayor actividad de los microorganismos. En general, el pH disminuye a medida que se consume la alcalinidad durante el progreso de la nitrificación. El progreso de la desnitrificación provoca el aumento general del pH en la etapa media y final probablemente75.

Se produjo un aumento y una caída cíclicos en los perfiles de pH durante la fase de aireación, a medida que el aireador se encendía y apagaba, lo que resultó en un pico y un valle bajo en cada período de aireación en los perfiles de pH76.

Un perfil típico de descenso rápido de temperatura como afluente se mezcló con el agua residual tratada que quedó en el reactor del ciclo anterior. La temperatura tocó fondo poco después de la fase de llenado. Después de este fondo, la temperatura aumentó debido a la actividad microbiana. Aproximadamente a los 250 min, la velocidad de aumento de la temperatura no tiene cambios más evidentes y continúa así durante el resto del ciclo. La figura 6 muestra el cambio de temperatura en un ciclo completo.

Perfil típico de temperatura.

Como se encontró, durante la primera etapa del ciclo, la temperatura aumentó con más fuerza que la última, probablemente porque la concentración de contaminantes difiere: la concentración de contaminantes de nivel más alto da como resultado una mayor actividad de los microorganismos, que es la razón principal del cambio de temperatura. La variación general de la temperatura de las aguas residuales en un determinado ciclo es relativamente pequeña, lo que está muy influenciado por la conducción de calor y el metabolismo microbiano del medio ambiente, mientras que la transferencia mecánica de calor, principalmente por las bombas y aireadores, tiene poca influencia en la variación de las aguas residuales. temperatura de tratamiento77.

De acuerdo con el principio del modelo RFR, el proceso de modelado se divide en cuatro pasos de la siguiente manera: (1) la recopilación de datos de muestra; (2) la determinación y clasificación de la importancia de las características; (3) se agregó un número diferente de características al modelo de bosque aleatorio para seleccionar la cantidad adecuada de características importantes; (4) Modelo RFR aplicado en la práctica.

Con base en los datos del proceso de operación, el modelo de sensor suave RFR se usa para establecer el modelo de predicción de DQO del efluente SBR, que realiza la predicción rápida de la calidad del efluente y proporciona la base para la operación eficiente y estable del proceso de tratamiento de aguas residuales como se muestra en la Fig. 7.

El equilibrio técnico entre los procedimientos SBR y el algoritmo RFR.

En este caso, se observó que los valores de temperatura aumentaban con la reducción de DQO y se consideró útil para identificar el final de la eliminación de DQO.

En la etapa temprana de la reacción bioquímica, el anabolismo de los microorganismos es intenso, lo que produce una cantidad de CO2. La cantidad de CO2 causada por el anabolismo es obviamente mayor que la de la aireación según el resultado de la medición (Fig. 5) en la etapa inicial. Además, la materia orgánica produce ácido orgánico, lo que hace que el valor del pH disminuya aún más. Menos materia orgánica residual provocó una menor producción de CO2 y ácidos orgánicos, y el predominio de la desnitrificación en la etapa media y final durante este período de tiempo contribuyó a un aumento general en el valor del pH. Por lo tanto, se observó que los valores de pH disminuían o aumentaban según la diferente materia orgánica y se consideró útil para identificar la cantidad residual de DQO.

Se construyeron y agregaron al conjunto de variables independientes una serie de variables de entrada sin procesar y procesadas tales como pH, temperatura, cambio de pH y temperatura en mediciones adyacentes, etc. Las variables de entrada procesadas seleccionadas se construyeron utilizando las características del perfil.

La ventaja de que el pH y la temperatura se tomaron como variables sin procesar es que es simple y fácil de detectar. Además, los sensores de pH y temperatura no solo son económicos, sino que también tienen una precisión de medición satisfactoria.

Cada conjunto de variables incluía una colección única de variables de entrada (Tabla 4). Dentro de cada ciclo de 480 min, los datos recopilados 0 ~ 30 min y 361 ~ 480 min se excluyeron para eliminar los efectos de los períodos de llenado y asentamiento (ya que estas fases no formaban parte de las fases de reacción biológica del ciclo de tratamiento).

Se recopilaron datos de 40 ciclos de tratamiento, 12 (30 %) de los cuales se separaron aleatoriamente para usarlos como conjunto de datos de prueba y el resto se usó como conjunto de datos de entrenamiento.

La efectividad del modelo de sensor suave RFR se evaluó a través de 5 criterios. El valor estándar de DQO del efluente se fijó en 30 mg/l. El valor estándar del efluente puede variar debido a las regulaciones locales. Los criterios de evaluación se enumeran en la Tabla 5.

La Tabla 6 muestra los parámetros relacionados de afluentes y efluentes.

El coeficiente de correlación de Pearson es una medida estadística utilizada para determinar la fuerza y dirección de la relación lineal entre dos variables. Los aspectos esenciales de la aplicación del coeficiente de correlación de Pearson en la clasificación de correlación de variables son: (1) El coeficiente de correlación de Pearson se usa comúnmente en el análisis de regresión múltiple para seleccionar las variables independientes más significativas mediante el cálculo de los coeficientes de correlación entre cada variable independiente; (2) El coeficiente de correlación varía de − 1 a 1, y cuanto mayor sea el valor absoluto, más fuerte será la correlación; (3) Cuando el valor del coeficiente de correlación es cercano a 0, indica que la correlación entre las dos variables es muy débil y pueden considerarse independientes.

Para garantizar el efecto de entrenamiento de la RFR, se utilizó el método del coeficiente de Pearson para estudiar la correlación de los sujetos, y se eliminaron las variables con correlación débil. Para evitar la aparición de variables no válidas, evitar el sobreajuste y mejorar el rendimiento de entrenamiento del modelo, se eliminó cualquier variable con un valor de coeficiente de correlación de Pearson normalizado, que se considera como la puntuación normalizada de importancia variable, inferior a 0,01. La puntuación normalizada resultante del diagrama de ordenación de importancia variable muestra los 12 factores que afectan la concentración de DQO (Fig. 8). Se encontró que ΔT tuvo la mayor influencia en la concentración de DQO, seguido de T, Tav, pHapex-nadir, etc.

Ranking de la puntuación de importancia de cada variable.

Se recogieron datos de 40 ciclos de tratamiento. El 70% de los datos completos (28 ciclos de tratamiento) se seleccionan aleatoriamente como conjunto de entrenamiento para el modelo RFR y el 30% (12 ciclos de tratamiento) se seleccionan como conjunto de prueba para verificar la precisión del modelo.

Con base en la clasificación de los puntajes de importancia de las variables, es evidente que las variables relacionadas con la temperatura ocupan las tres primeras posiciones. Por lo tanto, se puede concluir que las variables relacionadas con la temperatura juegan un papel dominante en el análisis de datos. Algunos estudios han demostrado que la actividad metabólica de las comunidades microbianas en los biorreactores de tratamiento de aguas residuales puede provocar un aumento de la temperatura del agua78,79. Esto se debe a que los microorganismos del reactor producen una gran cantidad de calor a través de la degradación y el metabolismo de la materia orgánica, lo que provoca un aumento de la temperatura en el interior del reactor. Además, cabe señalar que, si bien el pH es un factor contribuyente, su importancia no es tan fuerte como la de pHapex-nadir. pHapex-nadir, que se calcula por el valor de pH ápice menos el valor de pH nadir para cada período de aireación, cuantifica eficazmente la cantidad de dióxido de carbono generado por la actividad microbiana durante una agitación de 20 minutos.

Para seleccionar el conjunto de variables, se seleccionaron diferentes números de variables de acuerdo con la importancia de las variables, y luego se agregaron al modelo RFR, como se muestra en la Fig. 9. Se encontró que cuando se seleccionaron las 7 variables principales, el El R2 del conjunto de entrenamiento y el conjunto de prueba no aumentó y el MSE no disminuyó obviamente, por lo que se seleccionaron las 7 variables principales como la variable del modelo RF optimizado, específicas de la siguiente manera: ∆T, T, Tav, pHapex-nadir, pH, pHav y ∆pH.

Índices de evaluación con diferentes cuantitativas de variables.

La figura 10 muestra la comparación de las concentraciones de DQO previstas y medidas en el equipo de prueba.

Comparación de las concentraciones de DQO previstas y reales/medidas.

La tendencia de degradación de DQO, así como la desviación entre los valores pronosticados y medidos, se puede observar a partir de las variaciones en las curvas representadas en la Fig. 10. Los valores pronosticados permiten una estimación aproximada del efecto del procesamiento y el nivel de degradación del contaminante dentro de un solo ciclo. Aunque la precisión entre los valores reales y predichos puede no ser perfecta, la ligera discrepancia solo existe en la etapa inicial del proceso y pronto desaparece.

En el proceso de tratamiento de aguas residuales, el cambio de DQO está influenciado por varios factores inciertos en las condiciones de operación. Estos factores pueden causar diferencias significativas en la precisión de la predicción de DQO durante las diferentes etapas del procesamiento. En la etapa inicial, estos factores inciertos tienen una influencia más fuerte, lo que da como resultado un error evidente entre los valores predichos y medidos; con el paso del tiempo, las condiciones de procesamiento tienden a estabilizarse y el impacto de los factores inciertos en los cambios de DQO disminuye gradualmente, lo que conduce a una reducción del error entre los valores medidos y los predichos.

Por lo tanto, en la metodología propuesta, la magnitud del error entre los valores predichos y medidos se ve afectada principalmente por la etapa de procesamiento. En la etapa inicial, el error puede ser relativamente grande, pero a medida que pasa el tiempo, el error disminuirá gradualmente y finalmente alcanzará un efecto de predicción más preciso.

La salida del modelo del sensor suave RFR, que sirve como valor previsto de la calidad del agua en el escenario dado, puede ser fundamental para optimizar el proceso de tratamiento de aguas residuales. Esto se puede lograr reduciendo el consumo de energía y mejorando la eficiencia de los procesos químicos y biológicos. Específicamente, si el valor de DQO pronosticado cae por debajo del nivel estándar del efluente, el proceso puede pasar al modo de asentamiento inmediatamente, con el agitador y el aireador apagados, cerrando así el ciclo. Este método permite que la finalización del ciclo sea controlada por una inteligencia artificial y un sistema de control automático, a diferencia de un enfoque de control de tiempo fijo que carece de precisión. Esto se ilustra en la Fig. 11.

Condición de fin de ciclo.

La Tabla 7 muestra los resultados de la evaluación del conjunto de prueba 1–12.

RFR es un modelo de aprendizaje automático utilizado para tareas de análisis predictivo, en particular para problemas de regresión. RFR es un método de aprendizaje conjunto que combina múltiples modelos de árboles de decisión para crear un predictor más sólido y preciso.

El algoritmo RFR selecciona aleatoriamente subconjuntos de las variables de entrada y muestras de los datos de entrenamiento para construir árboles de decisión, que luego se combinan en un bosque. Durante la predicción, el modelo RFR agrega la salida de árboles de decisión individuales para producir una predicción final. Este enfoque ayuda a reducir el impacto del sobreajuste y mejora el rendimiento del modelo en los datos de salida.

En el contexto de las plantas de tratamiento de aguas residuales, el modelo de sensor suave RFR se puede usar para predecir la calidad del agua (COD) a través de diámetros más simples, de esta manera se reemplazarán los sensores complejos y costosos. Aunque un sensor de DQO genuino puede ser una opción, varias razones o factores pueden hacer que no sea adecuado y que surjan ciertos problemas: (1) Los sensores de DQO genuinos generalmente cuestan mucho; (2) Debido a la presencia de sólidos en suspensión en las aguas residuales, el valor de DQO medido por sensores de DQO genuinos puede ser inestable y exhibir fluctuaciones significativas; (3) Algunos sensores de DQO genuinos pueden detectar compuestos orgánicos con un doble enlace de manera sensible, mientras que otros compuestos orgánicos sin un doble enlace no se detectan, por lo que el error no se puede ignorar.

Además, el modelo RFR supera las deficiencias de la velocidad de convergencia lenta y la gran cantidad de muestras que requieren redes neuronales. Las redes neuronales son modelos poderosos que pueden aprender patrones complejos en los datos. Sin embargo, entrenar una red neuronal puede ser computacionalmente costoso y requerir una gran cantidad de datos. En particular, las redes neuronales profundas o las redes a gran escala pueden tardar mucho en converger durante el entrenamiento debido a la gran cantidad de parámetros que deben aprenderse a través de múltiples iteraciones.

Por el contrario, el modelo RFR se compone de múltiples modelos de árboles de decisión, cada uno entrenado en un subconjunto aleatorio de los datos. Este enfoque tiene ventajas: (1) el modelo RFR no requiere tantos datos como las redes neuronales, ya que cada modelo de árbol de decisión puede funcionar bien con conjuntos de datos más pequeños; (2) El modelo RFR se puede paralelizar fácilmente, lo que significa que se pueden entrenar más rápidamente que las redes neuronales en sistemas informáticos de varios núcleos.

En comparación con los métodos utilizados en la tecnología de eliminación de contaminantes (Tabla 1), la metodología propuesta requiere solo dos tipos de datos sin procesar que son fáciles de obtener, lo que reduce en gran medida la carga de trabajo de la adquisición de datos. La debilidad de la metodología propuesta es que el valor de predicción no es tan preciso entre el valor medido y el valor predicho en la primera etapa del progreso. Además, incluso si el R2 y el MSE del modelo RFR no son satisfactorios, funciona bien para predecir la precisión en el valor del umbral de corte, como se muestra en la Tabla 7, y esto es muy importante en el campo de la ingeniería.

En la aplicación práctica de la metodología propuesta, es posible que el valor DQO cumpla con el estándar mientras que otros indicadores como el amoníaco o el fósforo no lo hacen. Para abordar este problema, se pueden establecer modelos de relaciones utilizando el pH y la temperatura como variables para predecir los otros parámetros. Sin embargo, este enfoque se limita únicamente a los métodos de inteligencia artificial. Además, se puede establecer un sistema de juicio empírico, como que el tiempo de tratamiento de aguas residuales generalmente se encuentra dentro de un cierto rango, si los resultados pronosticados exceden este rango, se considera que los resultados de salida de la metodología propuesta requieren modificación.

Aumente la conductividad u otros parámetros fácilmente disponibles como variables de entrada para mejorar la precisión de la predicción. Las siguientes son discusiones detalladas:

Variables como la conductividad, el MLSS, el OD y el amoníaco también se pueden utilizar como premisas para predecir la DQO. El impacto en la precisión y eficiencia de la metodología propuesta puede ser: (1) En general, en el proceso de tratamiento de aguas residuales, la conductividad eléctrica de la solución muestra una tendencia a disminuir gradualmente, lo que está relacionado con la disminución del valor de DQO, por lo tanto la conductividad eléctrica puede mejorar la precisión y la eficiencia; (2) MLSS debería mostrar una tendencia de aumento gradual, sin embargo, el cambio de MLSS no es obvio en un ciclo (480 min). Además, la precisión del sensor MLSS se ve fácilmente afectada por el color de las aguas residuales, lo que obviamente aumentará la incertidumbre de los datos medidos por los sensores; (3) El SBR funciona de acuerdo con la periodicidad de aireación-agitación, el OD presenta un cambio de periodicidad de aumento a disminución, que obviamente no tiene correlación con la tendencia de cambio del valor de DQO; (4) Durante el proceso de tratamiento de aguas residuales, la concentración de amoníaco en la solución generalmente exhibe una disminución gradual, similar a la tendencia observada en DQO. Sin embargo, en algunos casos, como la falta de oxígeno disuelto que inhibe la nitrificación, puede que no haya una reducción significativa en el valor de amoníaco incluso cuando se reduce la DQO. Como resultado de la naturaleza no sincrónica de los cambios en estos dos parámetros, la predicción de la DQO utilizando amoníaco como variable puede generar incertidumbre en el análisis.

Cifrar la frecuencia de adquisición de datos, como recopilar datos cada 5 minutos, luego puede ser con cinco minutos de anticipación para predecir, lo que mejora aún más la eficiencia de la metodología propuesta.

Agregue amoníaco y fósforo como objetivos de predicción para equilibrar los indicadores de aguas residuales orgánicas e inorgánicas y mejorar la practicidad.

Se utilizaron sensores simples y estables (pH, temperatura) para predecir los valores de DQO durante todo el proceso. El modelo RFR empleado en el estudio puede considerarse como un "sensor suave", que ayuda a controlar el efecto del tratamiento.

El SBR se optimizó utilizando inteligencia artificial y un sistema de control automático para aumentar la automatización, así como ahorrar tiempo y energía. Los sensores de pH y temperatura recopilaron datos, que se ingresaron en el modelo RFR, el modelo luego generó valores COD en tiempo real. Una vez que el valor de DQO pronosticado cayó por debajo del valor estándar del efluente, el ciclo finalizó cortando el agitador y el aireador, y el proceso ingresó directamente al modo de asentamiento. La metodología propuesta reemplazó el control de tiempo fijo, que no estaba controlado. En 12 casos de prueba, el porcentaje de eliminación de DQO (%) fue de aproximadamente 91,075, mientras que se ahorró un promedio de 24,25% de tiempo o energía. Estos resultados demuestran que este enfoque puede aumentar la capacidad de tratamiento y reducir el consumo de energía, lo que representa una tecnología baja en carbono.

R2 en el conjunto de prueba es de alrededor de 0,791, aunque no es demasiado alto, pero la precisión en el valor umbral de corte de COD es de alrededor del 91 %, lo que es aceptable para la predicción. Es bastante simple y casi preciso adquirir el efecto de procesamiento y el nivel de degradación de los contaminantes en cualquier momento. Aunque no es tan preciso entre el valor real y el predictivo, la vergüenza solo ocurrió en la primera mitad del progreso y pronto desapareció. La precisión de la etapa media y final es más importante que la de la etapa temprana, la razón del hecho anterior se explica a continuación. La inteligencia artificial y el sistema de control automático condujeron a una forma optimizada, pero la precisión satisfecha de predecir el valor COD es un requisito previo. Basado en el hecho, los requisitos de precisión son diferentes en cada etapa en un escenario controlado: en la etapa media y final, especialmente cuando se acerca a la etapa de cumplimiento del estándar de efluentes, se pone mayor énfasis en la precisión y la exactitud. Sin embargo, en la etapa inicial, la precisión no afecta significativamente la estrategia de control.

Debido a la no linealidad y la incertidumbre de la variación del valor de pH con el tiempo en el proceso SBR, los resultados de predicción son inestables debido a los diferentes algoritmos y al sobreajuste del método ANN. Debido a la distribución de información paralela y el almacenamiento del preprocesamiento estructural, RFR tiene una fuerte tolerancia a fallas y la capacidad de adaptarse al entorno externo a través del aprendizaje. La capacidad de reconocimiento de patrones y el razonamiento comprensivo, sin duda, abre una amplia perspectiva para la investigación experimental.

Una limitación de esta investigación es su enfoque exclusivo en la metodología SBR. Sin embargo, existe la posibilidad de modificar el procedimiento para adaptarse a otras tecnologías, en particular los sistemas de tratamiento de aguas residuales por lotes. Al aumentar la frecuencia de la adquisición de datos, como la recopilación de datos cada 5 minutos, es posible predecir factores con hasta cinco minutos de anticipación, lo que mejora aún más la eficiencia de la metodología propuesta. Para mejorar su practicidad, el amoníaco y el fósforo podrían incluirse como objetivos de predicción, ya que esto ayudaría a equilibrar los indicadores de aguas residuales orgánicas e inorgánicas.

Los conjuntos de datos utilizados y/o analizados durante el estudio actual están disponibles del autor correspondiente a pedido razonable.

Chen, P., Zhao, W., Chen, D., Huang, Z. y Zhang, C. Progreso de la investigación sobre tecnologías de tratamiento integrado de aguas residuales domésticas rurales: una revisión. Agua 14(15), 2439–2439 (2022).

Artículo Google Académico

Wang, C. et al. Factores reveladores que influyen en la variación espacial en la cantidad y calidad de la descarga de aguas residuales domésticas rurales en China. Proceso seguro. Reinar. prot. 162, 200–210 (2022).

Artículo CAS Google Académico

Srivastava, G. et al. Influencia de las variaciones en las aguas residuales en la eliminación simultánea de nutrientes en un reactor por lotes de secuenciación a gran escala conectado a un selector preanóxico. En t. J. Medio Ambiente. ciencia Tecnología 1, 1–18 (2022).

CAS Google Académico

Masloń, A. Impacto de la distribución de aguas residuales de flujo desigual en la eficiencia tecnológica de un reactor por lotes de secuenciación. Sostenibilidad 14(4), 2405 (2022).

Artículo Google Académico

Alhazmi, HE, Yin, Z., Grubba, D., Majtacz, JB y Mąkinia, J. Comparación de la eficiencia de la desamonificación bajo diferentes concentraciones de OD en un reactor por lotes de secuenciación a escala de laboratorio. Agua 14(3), 368 (2022).

Artículo CAS Google Académico

Chen, D. & Li, H. Rendimiento mejorado de nitrificación y desnitrificación parcial simultánea de lodos granulares aeróbicos a través de aireación cónica en un reactor por lotes de secuenciación para el tratamiento de aguas residuales municipales de baja resistencia y baja relación COD/TN. Reinar. Res. 209, 112743 (2022).

Artículo CAS PubMed Google Académico

Schwitalla, P. et al. Ad/desorción de NH4+ en reactores por lotes de secuenciación: simulación, laboratorio y estudios a gran escala. ciencia del agua Tecnología 58(2), 345 (2008).

Artículo CAS PubMed Google Académico

Kauder, J., Boes, N., Pasel, C. & Herbell, JD Combinación de modelos ADM1 y ASM2d en una simulación de reactor por lotes de secuenciación. química Ing. Tecnología 30(8), 1100–1112 (2007).

Artículo CAS Google Académico

Wang, J., Zhao, X., Guo, Z., Yan, P. & Gao, X. Un método de gestión de vista completa basado en redes neuronales artificiales para el ahorro de energía y materiales en plantas de tratamiento de aguas residuales. Reinar. Res. 211, 113054 (2022).

Artículo CAS PubMed Google Académico

Alharbi, M., Hong, P.-Y., Laleg, K. y Taous, M. Detección de bacterias en plantas de tratamiento de aguas residuales basada en redes neuronales de ventana deslizante. J. Control de procesos 110, 35–44 (2022).

Artículo CAS Google Académico

Salim, H., Hilal, L. y Samir, F. Predicción de la demanda bioquímica de oxígeno en efluentes en una planta de tratamiento de aguas residuales utilizando un enfoque basado en una red neuronal de regresión generalizada: un estudio comparativo. Reinar. Proceso. 3(1), 153–165 (2016).

Artículo Google Académico

Sharghi, E., Nourani, V., Ashrafi, AA y Gökçekuş, H. Supervisión de la calidad de los efluentes de la planta de tratamiento de aguas residuales mediante el método de red neuronal artificial basado en agrupamiento. Desalinizar Tratamiento de agua. 164, 86–97 (2019).

Artículo CAS Google Académico

Hasanlou, H., Abdolabadi, H. y Aghashahi, M. Aplicación del análisis factorial en una simulación de planta de tratamiento de aguas residuales industriales a gran escala utilizando un enfoque híbrido de análisis de componentes principales y red neuronal artificial. Reinar. prog. Sostener. Energía 34(5), 1322–1331 (2015).

Artículo CAS Google Académico

Sadek, AH, Fahmy, OM, Mahmoud, N. & Mostafa, MK Predicción de la adsorción de Cu (II) de soluciones acuosas en nanoaluminio de valencia cero (nZVAL) mediante técnicas de aprendizaje automático e inteligencia artificial. Sostenibilidad 15(3), 2081 (2023).

Artículo CAS Google Académico

Faiz, AA, Mahmoud, N., Ismail, R. & Faizal, B. Red neuronal artificial y estimación tecnoeconómica con tratamiento terciario de aguas residuales basado en algas. J. Ing. de Procesos de Agua. 40, 101761 (2021).

Artículo Google Académico

Mohamed, GA & Mahmoud, N. Tratamiento de agua contaminada con diazinón por proceso electro-Fenton: efecto de los parámetros operativos y modelado de redes neuronales artificiales. Desalinizar Tratamiento de agua. 182, 277–287 (2020).

Artículo Google Académico

Mithil, KN et al. Red neuronal artificial y estimación de costes para la eliminación de Cr(VI) utilizando adsorbente compuesto policatiónico. Entorno de agua. J. 34 (S1), 29–40 (2019).

Google Académico

Fmahmoud, N., Karam, M., Michael, A. & Ibrahim, MG Capítulo 9: gestión sostenible de plantas de tratamiento de aguas residuales utilizando técnicas de inteligencia artificial. Tecnología informática blanda. Residuos Sólidos Gestión de Aguas Residuales 1, 171–185 (2021).

Google Académico

Nashia, D. et al. Inteligencia artificial y estadísticas multivariadas para la evaluación integral de bacterias filamentosas en plantas de tratamiento de aguas residuales que experimentan acumulación de lodos. Reinar. Tecnología innovador 19, 1 (2020).

Google Académico

Alberto, P. et al. Redes neuronales: una descripción general de las primeras investigaciones, los marcos actuales y los nuevos desafíos. Neurocomputación 214, 242–268 (2016).

Artículo Google Académico

Emon, M. & Mohaiminul, I. Una descripción general de la red neuronal artificial. Soy. J. Cómputo. ciencia aplicación 3(16), 1 (2019).

Google Académico

Kudus, SA et al. Una descripción general de la aplicación actual de la red neuronal artificial en concreto. Adv. Mate. Res. 626(626), 372 (2012).

Artículo Google Académico

Zelín, L. et al. Aplicación de redes neuronales artificiales en el cambio climático global y la investigación ecológica: una descripción general. Mentón. ciencia Toro. 55(34), 3853–3863 (2010).

Artículo Google Académico

Bhattacharjee, A., Murugan, R., Soni, B. & Goel, T. Ada-GridRF: un modelo de conjunto de bosque aleatorio optimizado para la detección del cáncer de pulmón basado en un impulso adaptativo rápido y automatizado. física Ing. ciencia Medicina. 45(3), 981–994 (2022).

Artículo PubMed Google Académico

Sun, D., Xu, J., Wen, H. & Wang, Y. Un modelo de bosque aleatorio optimizado y su capacidad de generalización en el mapeo de susceptibilidad a deslizamientos de tierra: aplicación en dos áreas del embalse de las Tres Gargantas de China. J. Ciencias de la Tierra. 31(6), 1068–1086 (2020).

Artículo Google Académico

Mateo, PV, Mesa, FJM, Villanueva, BJ & Alonso, Á. C. Un modelo de bosque aleatorio para la predicción del contenido de FOG en las aguas residuales de entrada de las EDAR urbanas. Agua 13(9), 1237 (2021).

Artículo Google Académico

Pengxiao, Z. et al. Un modelo de bosque aleatorio para la predicción de caudales en plantas de tratamiento de aguas residuales. Stoch. Env. Res. Evaluación de riesgos. 33(10), 1781–1792 (2019).

Artículo Google Académico

Olshen, RA, Leo, B. & Jerome, F. Árboles de clasificación y regresión. Chapman and Hall Press: Londres, Reino Unido 1, 10 (2017).

Google Académico

Ferrante, M., Demarco, P. & Origgi, D. OD177-Regresión de bosque aleatorio en datos de TC para predecir la dosis efectiva y la clase de dosis efectiva de conformidad con la nueva regulación italiana. física Medicina. 92, S138 (2021).

Artículo Google Académico

Srimathi, S., Yamuna, G. y Nanmaran, R. Modelo de regresión estocástica basado en umbrales con filtro Gabor para segmentación y clasificación de bosques aleatorios del cáncer de pulmón. J. Cómputo. teor. Nanosci. 16(4), 1666–1673 (2019).

Artículo CAS Google Académico

Cristina, Z. Modelado de la conexión entre el riesgo sistémico bancario y los proxies de liquidez del balance a través de regresiones de bosques aleatorios. Administración. ciencia 10(3), 52 (2020).

Artículo Google Académico

Yihui, C. & Minjie, L. Evaluación de los factores que influyen en la producción de té basada en la regresión forestal aleatoria y el valor de impacto medio. agricola economía 65, 340–347 (2019).

Google Académico

Luo, Y., Yan, J., Mcclure, SC & Li, F. Factores socioeconómicos y ambientales de la pobreza en China usando un modelo de regresión de bosque aleatorio ponderado geográficamente. Reinar. ciencia contaminar Res. En t. 29(22), 33205–33217 (2022).

Artículo PubMed PubMed Central Google Académico

Song, HE, Jianhua, WU, Wang, D. y Xiaodong, HE Modelado predictivo de la contaminación por nitratos en las aguas subterráneas y evaluación de sus principales factores de impacto utilizando bosques aleatorios. Chemosphere 290, 133388 (2021).

Google Académico

Zhangwen, SU, Lin, L., Chen, Y. & Hu, H. Comprensión de la distribución y los impulsores de las concentraciones de PM2.5 en el delta del río Yangtze de 2015 a 2020 mediante regresión forestal aleatoria. Reinar. Monitorear Evaluar. 194(4), 284 (2022).

Artículo Google Académico

Wang, Q. et al. Reconstrucción espacialmente explícita de la distribución de la población en la cuenca del río Tuojiang durante 1911-2010 mediante regresión forestal aleatoria. registro Reinar. Cambio 22(1), 1 (2022).

Artículo Google Académico

Wang, F. et al. Modelado de heterogeneidad espacial de la calidad del agua basado en la regresión aleatoria de bosques y la interpretación del modelo. Reinar. Res. 202, 111660 (2021).

Artículo CAS PubMed Google Académico

Shijun, C. et al. Pronóstico de escorrentía a mediano y largo plazo basado en un modelo de regresión forestal aleatoria. Abastecimiento de agua 20(8), 3658–3664 (2020).

Artículo Google Académico

Harrison, JW, Lucius, MA, Farrell, JL, Eichler, LW y Relyea, RA Predicción de las concentraciones de nitrógeno y fósforo en la corriente a partir de sensores de alta frecuencia mediante la regresión de bosques aleatorios. ciencia Entorno Total. 763, 143005 (2020).

Artículo ADS PubMed Google Scholar

Weiran, Y. et al. Evaluación de regresión forestal aleatoria y regresión lineal múltiple para predecir concentraciones de material particulado fino en interiores en una ciudad altamente contaminada. Reinar. contaminar 245, 746–753 (2018).

Google Académico

Kronholm, SC, Capel, PD & Terziotti, S. extrajeron estadísticamente variables de cuenca fundamentales para estimar las cargas de nitrógeno total en pequeños arroyos. Reinar. Modelo. Evaluar. 21(6), 681–690 (2016).

Artículo Google Académico

Shi, GY et al. Modelado de la respuesta de los iones de aire negativos a los factores ambientales mediante regresión lineal múltiple y bosque aleatorio. ecológico Informar. 66, 1 (2021).

Google Académico

Keramat, JM, Saeid, MS, Mousazadeh, H., Ghasemi, VM y Rahimi, MM Estudio de la proporción de humedad en tiempo real de chips de frutos secos de dátiles basado en atributos de imagen en línea utilizando kNN y métodos de regresión de bosque aleatorio. Medida 10, 8899 (2020).

Google Académico

Balogun, AL & Tella, A. Modelado e investigación de los impactos de las variables climáticas en la concentración de ozono en Malasia utilizando análisis de correlación con bosque aleatorio, regresión de árbol de decisión, regresión lineal y regresión de vector de soporte. Chemosphere 299, 134250 (2022).

Artículo ADS CAS PubMed Google Scholar

Wang, J. et al. Un método de gestión de vista completa basado en redes neuronales artificiales para el ahorro de energía y materiales en plantas de tratamiento de aguas residuales. Reinar. Res. 211, 113054 (2022).

Artículo CAS PubMed Google Académico

Fernandez de Canete, J. & Del Saz-Orozco, P. Estimación mediante detección suave de las concentraciones de efluentes de plantas en una planta de tratamiento biológico de aguas residuales utilizando una red neuronal óptima. Sistema experto aplicación 63, 8–19 (2016).

Artículo Google Académico

He, F., Wang, J. & Chen, W. Evaluación de producción más limpia para plantas de tratamiento de aguas residuales basada en una red neuronal artificial de retropropagación. Neuro quantol. 16(6), 1 (2018).

Google Académico

Zhao, HY, Huang, FL, Li, L. y Zhang, CY Optimización del tratamiento de digestión anaeróbica de aguas residuales basado en la red neuronal GA-BP. Desalinizar Tratamiento de agua. 122, 30–35 (2018).

Artículo CAS Google Académico

Junfei, Q., Gaitang, H., Honggui, H. y Wei, C. Método de control de tratamiento de aguas residuales basado en una red neuronal difusa recurrente adaptable a reglas. En t. J. Intel. computar cibernético 10(2), 94–110 (2017).

Artículo Google Académico

Watanabe, S. & Yamana, H. Medición de sobreajuste de redes neuronales convolucionales utilizando pesos de red entrenados. En t. J. ciencia de datos. Anal. 14(3), 261–278 (2022).

Artículo Google Académico

Kai, I., Yuta, O. y Moriya, N. Adaptación adicional del ecualizador no lineal basado en redes neuronales artificiales para señales multinivel en sistemas de comunicación óptica. Conferencia OPTO, 2020.

Oyedotun, OK, Olaniyi, EO y Khashman, A. Una revisión simple y práctica del sobreajuste en el aprendizaje de redes neuronales. En t. Aplicación J. Pat. reconocer 4(4), 307–328 (2017).

Artículo Google Académico

Buskirk, TD Inspección de los bosques y muestreo de los árboles: una descripción general de los árboles de clasificación y regresión y los bosques aleatorios con aplicaciones en la investigación de encuestas. sobrev. Practica 11(1), 1–13 (2018).

MathSciNet Google Académico

Matthias, S. & Rosie, YZ El algoritmo de bosque aleatorio para el aprendizaje estadístico. Pararse. ciencia genómica 20(1), 3–29 (2020).

Google Académico

Kim, B., Cha, JW, Chang, K. & Lee, C. Predicción de visibilidad sobre Corea del Sur basada en bosques aleatorios. Atmósfera 12(5), 552 (2021).

Artículo ADS CAS Google Académico

Massimo, S. et al. Un enfoque de bosque aleatorio para estimar las partículas diarias, el dióxido de nitrógeno y el ozono con una resolución espacial fina en Suecia. Atmósfera 11(3), 1 (2020).

Google Académico

Rubal, DK Evolving Método de evolución diferencial con bosque aleatorio para la predicción de la contaminación del aire. proc. computar ciencia 132, 824–833 (2018).

Artículo Google Académico

Shamsoddini, A., Aboodi, MR & Karami, J. Predicción de contaminantes atmosféricos de Teherán basada en métodos de selección aleatoria de características del bosque. En t. Arco. Fotograma. Remote Sens. Spatia 4, 483–488 (2017).

Artículo Google Académico

Shi, G.-Y. et al. Modelado de la respuesta de los iones de aire negativos a los factores ambientales mediante regresión lineal múltiple y bosque aleatorio. Ecol. información 66, 1 (2021).

Artículo Google Académico

Min, JS et al. Identificación de los principales causantes de las emisiones de N2O de los sistemas biológicos de eliminación de nitrógeno a gran escala utilizando un enfoque de bosque aleatorio. Agua Res. 184, 116–144 (2020).

Google Académico

Vitorino, D. et al. Un algoritmo de bosque aleatorio aplicado al modelado y pronóstico del deterioro de las aguas residuales basado en la condición. proc. Ing. 89, 401–410 (2014).

Artículo Google Académico

Buras, MP & Solano, DF Identificación y estimación de la ubicación de fuentes de contaminación industrial en la red de alcantarillado. Sensores 21(10), 3426 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Medl, M., Rajamanickam, V., Striedner, G. & Newton, J. Desarrollo y validación de un sensor blando de densidad óptica basado en redes neuronales artificiales para un sistema de fermentación de alto rendimiento. J. Procesos 11(1), 297–307 (2023).

Artículo CAS Google Académico

Cong, QM, Bo, G.-H. y Shi, H.-Y. Sensor blando integrado de DQO para EDAR basado en modelo ASP y red neuronal RBF. J.Meas. Control 56(1–2), 295–303 (2023).

Artículo Google Académico

Hema, P. et al. Sistemas robustos de sensores blandos para la industria: evaluados a través de un estudio de caso en tiempo real. J.Meas. Sens. 24, 1 (2022).

Google Académico

Severino, AGV, De, LJMM & De, AFMU Sensor blando industrial optimizado por PSO mejorado: un enfoque de aprendizaje de representación profunda. J. Sens. 22(18), 6887–6899 (2022).

Artículo ANUNCIOS Google Académico

Dimitriadis, SI & Liparas, D. ¿Qué tan aleatorio es el bosque aleatorio? Algoritmo de bosque aleatorio en el servicio de biomarcadores de imágenes estructurales para la enfermedad de Alzheimer: de la base de datos de la iniciativa de neuroimagen de la enfermedad de Alzheimer (ADNI). Regeneración Neural. Res. 13(6), 962–970 (2018).

Artículo PubMed PubMed Central Google Académico

Jaime, LS et al. Una comparación de métodos aleatorios de selección de variables forestales para el modelado de predicción de clasificación. Sistema experto aplicación 134, 93–101 (2019).

Artículo Google Académico

Christopher, S., Margaret, GS, Chuck, EB y Anders, K. Clasificación semiautomática de la cubierta de lecho rocoso expuesto en las montañas del sur de la Columbia Británica utilizando un enfoque de bosque aleatorio. Geomorfología 285, 214–224 (2017).

Artículo Google Académico

Hristos, T. & Georgia, P. Una breve revisión de bosques aleatorios para científicos y profesionales del agua y su historia reciente en recursos hídricos. Agua 11(5), 910 (2019).

Artículo Google Académico

Kamakshaiah, M. & Prasada Rao, SS Aplicabilidad del pronóstico de bosques aleatorios al comercio internacional de divisas: una investigación a través del lenguaje. En t. J. Autobús. Anal. Intel. 6(1), 47–57 (2018).

Google Académico

Shu, FY, Joo, HT & Yu, L. Efecto de la proporción de demanda de oxígeno químico/nitrógeno del sustrato en la formación de gránulos aeróbicos. J. Medio Ambiente. Ing. 131(1), 86–92 (2005).

Artículo Google Académico

Tanwar, P., Nandy, T., Ukey, P. y Manekar, P. Correlación de parámetros de monitoreo en línea, pH, OD y ORP con la eliminación de nutrientes en un sistema de biorreactor de proceso cíclico intermitente. Biores. Tecnología 99, 7630–7635 (2008).

Artículo CAS Google Académico

Chang, CH & Hao, OJ Sistema de reactor por lotes de secuenciación para la eliminación de nutrientes: perfiles de ORP y pH. J. Chem. Tecnología Biotecnología. En t. Res. Entorno de proceso. Tecnología limpia. 67, 27–38 (1996).

CAS Google Académico

Tong, Q., Mao, Z., & Sun, L. Variación del valor de OD y pH en el proceso de tratamiento de lixiviados de vertedero por SBR. proc. año Encontrarse. Silicato de China Soc. Reinar. Proteger. 325–328 (2007).

Shane, F., Mcdermott, J., Doherty, E., Cooney, R. y Clifford, E. Aplicación de redes neuronales y modelado de regresión para permitir el cumplimiento normativo ambiental y la optimización energética en un reactor por lotes de secuenciación. Sostenibilidad 14, 4098 (2022).

Artículo Google Académico

Hao, X., Sun, S., Li, J. & Liu, R. Establecimiento y verificación de un modelo de temperatura para el proceso de tratamiento de agua. J. Medio Ambiente. ciencia (China) 42(12), 1–11 (2022).

CAS Google Académico

Pochwała, S. & Kotas, P. Posibilidad de obtener calor de aguas residuales de una planta de tratamiento de aguas residuales por medio de una bomba de calor: un estudio de caso. Conferencia web E3S. 44, 144–144 (2018).

Liang, J., Zhang, P., Cai, Y., Wang, Q. y Zhou, Z. Efectos térmicos. Entorno de agua. Res. publ. Entorno de agua. Alimentado. 92(10), 1406–1411 (2020).

Descargar referencias

La investigación cuenta con el apoyo del Proyecto Clave de Investigación y Desarrollo del Plan Provincial de Ciencia y Tecnología de Sichuan, China (22ZDYF1876).

Departamento de Ingeniería Ambiental y de Materiales, Universidad Tecnológica de Chengdu, Chengdu, China

Qiu Cheng y Li Qianglin

Huicai Environmental Technology Co., Ltd., De Yuan Zhen, distrito de Pidu, Chengdu, Sichuan, China

zhan chun hong

También puede buscar este autor en PubMed Google Scholar

CQ, CZ y QL escribieron el texto principal del manuscrito y todas las figuras y tablas. Todos los autores revisaron el manuscrito.

Correspondencia a Li Qianglin.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Cheng, Q., Chunhong, Z. y Qianglin, L. Desarrollo y aplicación de un modelo de sensor suave de regresión forestal aleatoria para el tratamiento de aguas residuales domésticas en un reactor por lotes de secuenciación. Informe científico 13, 9149 (2023). https://doi.org/10.1038/s41598-023-36333-8

Descargar cita

Recibido: 22 febrero 2023

Aceptado: 01 junio 2023

Publicado: 05 junio 2023

DOI: https://doi.org/10.1038/s41598-023-36333-8

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.