Información

¿Existe una referencia estándar para la importancia de la heterogeneidad tumoral?

¿Existe una referencia estándar para la importancia de la heterogeneidad tumoral?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

En una publicación reciente, Philip Gerlee destacó las dos mayores contribuciones de la oncología matemática a la investigación del cáncer: (1) un mayor enfoque en el progreso del cáncer como un proceso evolutivo, y (2) analizar la importancia de la heterogeneidad tumoral.

Para el primer punto, la referencia histórica estándar es: Nowell, P. C. (1976). La evolución clonal de poblaciones de células tumorales. Ciencias, 194(4260): 23-28.

Sin embargo, para el segundo punto, aunque conozco vagamente el trabajo moderno, no conozco ninguna referencia histórica. ¿Cuándo se reconoció por primera vez la heterogeneidad tumoral como importante para la dinámica y el tratamiento del cáncer? ¿Estuvo este trabajo relacionado con conocimientos matemáticos o de otros modelos? Si no es así, ¿cuál es el primer trabajo de modelado matemático (o computacional) importante sobre la heterogeneidad tumoral?


Es bastante interesante que la primera referencia que me viene a la mente no es matemática / teórica (que, con toda probabilidad, va a ser mucho más antigua que la que voy a mencionar) sino clínica. Serían Gerlinger y Swanton y su artículo en el New England Journal of Medicine.


La idea de heterogeneidad tumoral ha existido durante mucho tiempo (mire la revisión a continuación y las referencias que contiene), pero las causas subyacentes se han revisado a la luz de los avances teóricos y los datos genéticos novedosos (Gerlinger et al.).

En primer lugar, se creía en gran medida que la heterogeneidad genética era la causa de la inestabilidad genética (un aumento de la tasa de mutación) y, por lo tanto, se atribuía a la deriva en lugar de a múltiples picos de aptitud (es decir, selección).

En segundo lugar, no hubo evidencia para determinar si la heterogeneidad fenotípica observada (de los portaobjetos de histología) podría atribuirse a cambios genéticos, o si fue la causa de la plasticidad fenotípica.

Alexandrova, Tumor Heterogeneity, Exp. Pathol. Parasitol (2001).


Heppner GH. Heterogeneidad tumoral. Cancer Res. 198444 (6): 2259–65.

Asselin MC, O'Connor JP, Boellaard R, Thacker NA, Jackson A. Cuantificación de la heterogeneidad en tumores humanos mediante resonancia magnética y PET. Eur J Cancer. 201248 (4): 447–55.

Chicklore S, Goh V, Siddique M, Roy A, Marsden PK, Cook GJ. Cuantificación de la heterogeneidad tumoral en imágenes de PET / TC con 18F-FDG mediante análisis de textura. Eur J Nucl Med Mol Imaging. 201340: 133–40. doi: 10.1007 / s00259-012-2247-0.

El Naqa I, Grigsby P, Apte A, Kidd E, Donnelly E, Khullar D, et al. Exploración de enfoques basados ​​en características en imágenes PET para predecir los resultados del tratamiento del cáncer. Reconocimiento de patrones. 200942 (6): 1162–71.

Tixier F, Le Rest CC, Hatt M, Albarghach N, Pradier O, Metges J-P, et al. La heterogeneidad intratumoral caracterizada por características de textura en las imágenes de PET con 18F-FDG basales predice la respuesta a la radioquimioterapia concomitante en el cáncer de esófago. J Nucl Med. 201152 (3): 369–78.

Yang F, Thomas MA, Dehdashti F, Grigsby PW. Análisis temporal de la heterogeneidad metabólica intratumoral caracterizada por características de textura en el cáncer de cuello uterino. Eur J Nucl Med Mol Imaging. 201340 (5): 716–27.

Haralick RM, Shanmugam K, Dinstein I. Características de textura para la clasificación de imágenes. IEEE Trans Syst Man Cybern. 19733: 610-21.

Haidekker MA. Análisis avanzado de imágenes biomédicas. 1ª ed. Hoboken: Wiley 2011.

Wahl RL, Herman JM, Ford E. La promesa y los peligros de la tomografía por emisión de positrones y la radioterapia guiada por imágenes moleculares por tomografía computarizada por emisión de fotón único. Semin Radiat Oncol. 201121 (2): 88–100.

Erlandsson K, Buvat I, Pretorius PH, Thomas BA, Hutton BF. Una revisión de las técnicas de corrección de volumen parcial para tomografía por emisión y sus aplicaciones en neurología, cardiología y oncología. Phys Med Biol. 201257: R119–59.


Heterogeneidad en el cáncer de mama

1 Departamento de Oncología Médica, Instituto de Cáncer Dana-Farber, Hospital Brigham and Women, Facultad de Medicina de Harvard, Boston, Massachusetts, EE. UU. 2 Instituto de Células Madre de Harvard, Cambridge, Massachusetts, EE. UU.

Envíe la correspondencia a: Kornelia Polyak, Dana-Farber Cancer Institute, 450 Brookline Ave. D740C, Boston, Massachusetts 02215, EE. UU. Teléfono: 617.632.2106 Fax: 617.582.8490 Correo electrónico: [email protected]

El cáncer de mama es una enfermedad heterogénea. Existe un alto grado de diversidad entre los tumores y dentro de ellos, así como entre los individuos portadores de cáncer, y todos estos factores juntos determinan el riesgo de progresión de la enfermedad y la resistencia terapéutica. Los avances en tecnologías como la secuenciación del genoma completo y las pantallas de viabilidad funcional ahora nos permiten analizar tumores a profundidades sin precedentes. Sin embargo, traducir este conocimiento cada vez mayor en la práctica clínica sigue siendo un desafío, en parte debido a la evolución del tumor impulsada por la diversidad de poblaciones de células cancerosas y su microambiente. Los artículos de esta serie de revisión discuten los avances recientes en nuestra comprensión de la heterogeneidad de los tumores de mama, las terapias adaptadas en función de este conocimiento y las formas futuras de evaluar y tratar los tumores heterogéneos.

El cáncer de mama es un grupo heterogéneo de neoplasias que se originan en las células epiteliales que recubren los conductos lácteos. La heterogeneidad del tumor de mama se ha observado en la histología y el resultado clínico durante mucho tiempo, y estas diferencias han servido como base para la clasificación de la enfermedad. Más recientemente, la clasificación tradicional, principalmente basada en la patología, se ha refinado y, en ocasiones, se ha reemplazado por clasificaciones moleculares, que tienen el potencial de combinar los mecanismos de la enfermedad con las medidas de resultado clínico. Sin embargo, la sorprendente heterogeneidad en los fenotipos de las células cancerosas acompañada de la plasticidad dinámica del microambiente del tumor hace que la categorización del tumor sea una tarea exigente, especialmente en lo que se refiere a las respuestas terapéuticas y la progresión de la enfermedad.

Este número de la JCI características Revisiones sobre varios aspectos de la heterogeneidad en el cáncer de mama, así como nuevos enfoques para evaluar y tratar los tumores de mama basados ​​en mejoras en las tecnologías y el conocimiento molecular. Morag Park y José Baselga y sus colegas revisan el estado actual de la clasificación del cáncer de mama (1) y las opciones de tratamiento diseñadas con base en este conocimiento (2), respectivamente. Max Wicha y sus colaboradores discuten el papel potencial de las células madre cancerosas y sus intrincadas interacciones con las células que constituyen el microambiente como posibles mecanismos subyacentes a la heterogeneidad intratumoral (3). Por último, Anne-Lise Borresen-Dale y sus colegas resumen los avances recientes en las tecnologías de secuenciación de ADN y su utilidad para evaluar la diversidad genética dentro de los tumores (4).

El cáncer de mama es uno de los pocos tipos de tumores en los que la clasificación molecular se ha utilizado con éxito para el diseño de terapias individualizadas, lo que ha conducido a mejoras significativas en la supervivencia específica de la enfermedad (5). Con base en el perfil completo de expresión génica, los tumores de mama se clasifican en al menos tres subtipos principales: luminal, receptor del factor de crecimiento epidérmico humano 2 + (HER2 +) y basal similar (6, 7). Cada uno de estos subtipos tiene diferentes factores de riesgo de incidencia, respuesta al tratamiento, riesgo de progresión de la enfermedad y sitios preferenciales de metástasis en los órganos. Los tumores luminales son positivos para los receptores de estrógeno y progesterona, y la mayoría responde bien a las intervenciones hormonales, mientras que los tumores HER2 + tienen amplificación y sobreexpresión de la ERBB2 oncogénico y se puede controlar eficazmente con una amplia gama de terapias anti-HER2. Los tumores de tipo basal en general carecen de receptores hormonales y de HER2, por lo que la mayoría de estos tumores también se denominan cáncer de mama triple negativo (TNBC). Actualmente no existe una terapia dirigida de base molecular para el TNBC y, desafortunadamente, solo aproximadamente el 20% de estos tumores responden bien a la quimioterapia estándar. Por lo tanto, el desarrollo de tratamientos mejorados para TNBC es una de las principales prioridades de la investigación actual sobre el cáncer de mama. Numerosos agentes se encuentran en diversas fases de desarrollo clínico, incluidos varios inhibidores de poli (ADP-ribosa) polimerasa, JAK quinasa e inhibidores de EGFR, así como agentes quimioterapéuticos clásicos "revividos" como las sales de platino. Sin embargo, hasta ahora ninguno de estos parece prometedor para el tratamiento de todos los TNBC, un hallazgo que quizás no sea sorprendente dado que varios estudios recientes han descrito que incluso esta clase relativamente pequeña de tumores de mama se puede dividir en cinco o seis subclases, cada una con su propias características moleculares y sensibilidad única a los agentes terapéuticos (8 - 10).

Se han propuesto varias hipótesis para explicar el origen de la heterogeneidad entre tumores en el cáncer de mama, incluidos los subtipos específicos de células tumorales de origen y los eventos de transformación (11). En consecuencia, los tumores luminales y HER2 + pueden originarse a partir de progenitores comprometidos con el linaje luminal, mientras que los casos de tipo basal surgen de células similares a células madre menos diferenciadas. Sin embargo, los patrones de expresión génica y la evidencia experimental en los sistemas modelo implican que los progenitores luminales también pueden servir como precursores de tumores de tipo basal después de eventos genéticos o epigenéticos que cambian los fenotipos celulares (12 - 14). Por ejemplo, la pérdida de BRCA1 o PTEN en las células del epitelio luminal conduce a la pérdida de la diferenciación luminal, y la transformación oncogénica de estas células da como resultado la formación de tumores de tipo basal (15). Sin embargo, debido a que sabemos que no todos los tumores ER + / HER2 +, o tumores de tipo basal, son iguales, es probable que existan múltiples formas de desarrollar cada uno de estos tipos de tumores.

Definir la célula de origen y la vía evolutiva de un cáncer de mama en humanos es una tarea casi imposible, ya que rara vez podemos diagnosticar tumores en sus primeras etapas y seguir su evolución molecular. Actualmente se han utilizado tres enfoques principales para rastrear la historia evolutiva del cáncer humano. Un método consiste en analizar los tumores a nivel de una sola célula en busca de rasgos fenotípicos y alteraciones genéticas somáticas, basándose en la suposición de que algunas células pueden ser reliquias del pasado del tumor y que su frecuencia dentro de un tumor puede revelar los pasos probables de la evolución del tumor. evolución (16). Otro enfoque analiza una gran colección de tumores en diferentes etapas de progresión para detectar cambios moleculares y, en función de la frecuencia con la que se detectan en una etapa de progresión específica, se puede ensamblar su probable orden de eventos (17, 18). Hasta ahora, estos enfoques se han utilizado para mapear la evolución del cáncer de colon (19) y de páncreas (20), pero no se han realizado estudios similares en tumores de mama. Por supuesto, ambos métodos se basan en ciertos supuestos, como la frecuencia de alteraciones genéticas somáticas en relación con su orden, aunque esto puede estar en duda dado un estudio reciente que describe la adquisición de varios cambios genéticos somáticos por células tumorales debido a un reordenamiento catastrófico único de los cromosomas (21). Se pensó que la definición de la célula de origen del cáncer era relevante solo para los estudios de predicción de riesgos y quimioprevención. Sin embargo, si la célula de origen tiene una influencia importante en la ruta evolutiva de un tumor en lo que respecta a la identidad y la frecuencia de los eventos transformadores adquiridos, entonces su caracterización también sería importante para comprender mejor los subtipos de tumores de mama.

Además de las numerosas diferencias detectadas entre los tumores, las células cancerosas dentro de un tumor de un paciente en un momento dado con frecuencia muestran una heterogeneidad sorprendente para varios rasgos relacionados con la tumorigénesis, como el potencial angiogénico, invasivo y metastásico (22). Algunos de estos se deben a la diversidad clonal y celular de alteraciones genéticas y epigenéticas, mientras que otros pueden reflejar mecanismos no hereditarios como respuestas adaptativas o fluctuación en los niveles de proteínas y la actividad de las vías de señalización. La heterogeneidad intratumoral también puede ser la base de la heterogeneidad intertumor y ayudar a explicar los subtipos de tumores de mama simplemente como tumores que se componen de diferentes "mezclas" de células cancerosas (Figura 1).

Modelo hipotético que explica los orígenes de la heterogeneidad intertumor e intratumoral en el cáncer de mama. La heterogeneidad intratumoral se debe a la presencia de células cancerosas con fenotipos variables, como diferentes grados de características basales y luminales. La heterogeneidad entre tumores también puede explicarse por la presencia de estos diferentes tipos de células dentro de los tumores en frecuencias variables. Las células cancerosas con un fenotipo de tipo basal predominan en los tumores de tipo basal, mientras que los tumores luminales están compuestos en gran parte por células de cáncer de mama luminal. Sin embargo, debido a la variabilidad en los rasgos celulares de tipo basal y luminal, no todos los tumores de tipo basal y luminal son iguales, lo que contribuye aún más a la heterogeneidad incluso dentro de los subtipos de tumores.

Los estados de diferenciación celular se definen por mecanismos epigenéticos que incluyen patrones de modificación de cromatina y metilación del ADN específicos del tipo celular. Por tanto, es posible que parte de la variabilidad epigenética entre las células tumorales sea un reflejo de sus estados de diferenciación. En algunos casos, los tumores pueden iniciarse a partir de una célula madre o progenitora, que tiene una capacidad conservada para dar lugar a una progenie más diferenciada, lo que da como resultado un tumor heterogéneo. El mejor ejemplo de esto han sido ciertas formas de neoplasias hematopoyéticas, en las que se ha descrito una célula madre leucémica (23). Este modelo de células madre cancerosas se ha expandido a numerosos tipos de tumores, incluido el cáncer de mama (24), pero la interpretación y validez de este modelo ha sido ampliamente cuestionada. Una de las características definitorias de una célula madre cancerosa es la capacidad de iniciar un tumor en los ensayos de trasplante de xenoinjerto, que reproduce más o menos el fenotipo del tumor original. Sin embargo, esta definición resultó ser muy dependiente del ensayo (25, 26) y, por lo tanto, puede que no refleje con precisión las verdaderas características de las células en su entorno fisiológico (es decir, en los pacientes).

En la mayoría de los tumores de mama, se pueden detectar células cancerosas con características similares a las de las células madre y más diferenciadas, pero la existencia de una jerarquía de diferenciación simple ha sido cuestionada por el alto grado de diversidad genética dentro y entre estas dos poblaciones de células (27). De manera similar, dos estudios recientes describieron la heterogeneidad genética y la evolución clonal de las células madre de leucemia (iniciadoras de tumores) utilizando ensayos de trasplante de células individuales (28, 29). En consecuencia, la composición clonal y los fenotipos celulares cambian continuamente durante la progresión del tumor, lo que convierte a los tumores en objetivos móviles y plantea un desafío importante para el tratamiento eficaz del cáncer. Es probable que una mejor comprensión de los mecanismos que mantienen la heterogeneidad de las células tumorales, como las redes de señalización de citocinas entre las células cancerosas y el microambiente tumoral, ayude en el diseño de terapias mejoradas. Un ejemplo de esto es la identificación reciente de la vía IL-6 / JAK / STAT3, que puede apoyar el crecimiento y la supervivencia de las células tumorales de manera autocrina o paracrina, como una nueva diana terapéutica en un subconjunto de tumores de mama (30, 31). . Dado que los compuestos que se dirigen a esta vía ya se han sometido a ensayos clínicos para otras indicaciones, probarlos en el cáncer de mama se puede realizar con bastante facilidad y rapidez.

Una de las formas más completas de abordar la diversidad intratumoral e identificar clones potencialmente resistentes incluso antes de que se expandan y conduzcan al fracaso del tratamiento es la secuenciación del genoma completo de todas las células cancerosas individuales dentro de los tumores. Tal experimento no se ha realizado ni puede que nunca se lleve a cabo. Sin embargo, el muestreo del tumor o la secuenciación profunda de tumores en masa representan alternativas bastante cercanas. Wigler y sus colegas describieron uno de los primeros intentos de este tipo en un tumor de mama, en el que secuenciaron completamente 100 células tumorales (16). De manera similar, varios estudios recientes han realizado la secuenciación del exoma o del genoma completo de tumores individuales o de un panel de tumores de mama (32 - 34). Con los avances continuos en las tecnologías de secuenciación de ADN, es probable que se logre la secuenciación profunda de células individuales, tal vez incluso de una manera que preserve la información sobre la topología dentro de los tumores (por ejemplo, la ubicación de las células cancerosas con mutaciones específicas). Sin embargo, la interpretación y la traducción clínica de estos resultados siguen siendo un desafío importante. Por ejemplo, filtrar las mutaciones que impulsan el tumor de los "pasajeros" no es una tarea fácil, especialmente si se considera que los roles de las mutaciones del conductor y del pasajero pueden cambiar de lugar a medida que evoluciona el tumor. La combinación de estudios de secuenciación del genoma completo con pantallas funcionales de alto rendimiento bien diseñadas en modelos fisiológicamente relevantes probablemente facilitará la traducción de estos avances técnicos en la práctica clínica.

A primera vista, la tremenda heterogeneidad y la naturaleza en continua evolución de los tumores parece abrumadora y hace que curar o incluso controlar eficazmente el cáncer sea una tarea casi imposible. Sin embargo, creo firmemente que un conocimiento profundo de la evolución del tumor conducirá a la erradicación y tal vez incluso a la prevención de esta enfermedad.

El autor agradece a Franziska Michor, Andriy Marusyk e Ian Krop por su lectura crítica de este manuscrito y sus útiles discusiones. K. Polyak cuenta con el apoyo del Instituto Nacional del Cáncer, la Investigación Dirigida por el Congreso del Ejército de los EE. UU., La Fundación de Investigación Avon, la Fundación V, la Fundación de Investigación del Cáncer de Mama, Novartis Pharmaceuticals Inc. y la Fundación Susan G. Komen.

Conflicto de intereses: K. Polyak recibe apoyo para la investigación de Novartis Oncology y es consultor de Novartis Oncology. También forma parte del Consejo Asesor Científico de Metamark Genetics Inc. y Theracrine Inc. y posee acciones de AVEO Pharmaceuticals Inc.

Informacion de referencia: J Clin Invest. 2011121 (10): 3786–3788. doi: 10.1172 / JCI60534.


Resultados

Problema de descomposición de mezcla de máxima verosimilitud

Primero, formularemos el problema de descomposición de la mezcla de máxima probabilidad de encontrar la mezcla más probable de poblaciones de células tumorales a partir de una muestra de tumor secuenciada. Suponemos que las lecturas secuenciadas de una muestra de tumor están alineadas con el genoma humano de referencia, el primer paso en el análisis de secuenciación del genoma del cáncer [30, 31]. Normalmente, también se secuencia un genoma normal emparejado para distinguir las mutaciones somáticas de las variantes de la línea germinal. Nos centramos en las aberraciones del número de copias para estimar la pureza del tumor y las subpoblaciones. Por lo tanto, asumimos que un genoma de cáncer se diferencia del genoma de referencia por las ganancias y pérdidas de segmentos, o intervalos, del genoma de referencia.Estos intervalos se identifican examinando la densidad o profundidad de las lecturas que se alinean con cada ubicación en la referencia [32-34], y / o agrupando lecturas emparejadas discordantes que identifican los puntos de ruptura de las aberraciones del número de copias u otras reordenaciones [35-40 ]. Después de este análisis, el genoma de referencia se divide en una secuencia I = (I1, . I metro) de intervalos no superpuestos. Representamos un genoma de cáncer mediante un vector de recuento de intervalos C = (C1, . C metro), dónde C j ∈ ℕ es el número entero de copias del intervalo I j en el genoma del cáncer. A partir de la secuenciación de una muestra de tumor, observamos un vector de profundidad de lectura r = (r1, . r metro), dónde r j ∈ ℕ es el número de lecturas con una alineación (única) dentro I j.

Una muestra de tumor es una mezcla de células que contienen diferentes colecciones de mutaciones somáticas y, en particular, aberraciones del número de copias somáticas. Suponemos que la muestra de tumor es una mezcla de norte subpoblaciones, incluida una subpoblación de células normales y una o más subpoblaciones de células cancerosas. Cada subpoblación tiene un vector de recuento de intervalo distinto que representa el genoma de la subpoblación. Por lo tanto, representamos una muestra de tumor T por: (1) una metro × norte matriz de recuento de intervalos C = [C J h], dónde C J h ∈ ℕ es el número de copias del intervalo I j en el hsubpoblación distinta y (2) un vector de mezcla del genoma μ ∈ ℝ norte dónde μ h es la fracción de células en T del hth subpoblación. Dado un vector de profundidad de lectura r derivado de la secuencia de T, nuestro objetivo es identificar la matriz de recuento de intervalos subyacente C y vector de mezcla de genoma μ que mejor describe r (Figura 1). Formulamos el siguiente problema.

Descripción general del algoritmo. Una mezcla de tres subpoblaciones con dos genomas distintos: un genoma normal (representado aquí con una copia de cada intervalo para simplificar) y un genoma aneuploide con una duplicación de un intervalo (rojo). Si las lecturas se distribuyen uniformemente sobre el ADN agregado en la muestra, entonces la distribución observada de lecturas en los intervalos azul, rojo y amarillo seguirá una distribución multinomial con el parámetro C μ ^. Aquí C es la matriz de recuento de intervalos que da el número integral de copias de cada intervalo en cada genoma de la mezcla, y μ es el vector de mezcla del genoma que da la proporción de cada subpoblación en la mezcla. Encontramos el par (C, μ) que maximiza la probabilidad del vector de profundidad de lectura observado r.

Problema de descomposición de mezcla de máxima verosimilitud (MLMDP). Dada una partición de intervalo I de un genoma de referencia y un vector de profundidad de lectura asociado r derivado de una muestra de tumor T, encontrar la matriz de recuento de intervalos subyacente C y el vector de mezcla del genoma μ que maximizan la probabilidad P(r | C , μ).

En la sección Materiales y métodos a continuación, derivamos la probabilidad PAG(r|C, μ) en el MLMDP. En resumen, bajo los supuestos habituales para la secuenciación del ADN, la probabilidad pag j que una lectura que se alinea con un intervalo I j es igual a la fracción del ADN total en la muestra que se origina en el intervalo I j. Por tanto, la probabilidad PAG(r|C, μ) del vector de profundidad de lectura observado r sigue una distribución multinomial determinada por la matriz de recuento de intervalos C y vector de mezcla de genoma μ. Enfatizamos que la distribución multinomial modela el hecho de que el número de lecturas que se alinean con cada intervalo no son variables aleatorias independientes, sino que dependen del número de copias (ploidía) de cada intervalo en el (los) genoma (s) del cáncer (ver Adicional archivo 1, sección A). En contraste con nuestro modelo probabilístico para la secuenciación de datos de ADN, otros métodos para estimar la pureza y la ploidía del tumor [12, 13] no modelan los datos como una observación de un experimento. Más bien, asumen que la proporción de número de copias observadas de un intervalo (o sonda) es la proporción del valor esperado del número de copias del tumor y el valor esperado del número de copias normal (consulte el archivo adicional 1, Sección B). Por lo tanto, suponen implícitamente que los datos observados son un promedio de muchos experimentos.

Resolver el problema de descomposición de la mezcla de máxima verosimilitud

Ahora damos una descripción general de nuestro algoritmo para resolver la instancia del MLMDP donde PAG(r|C, μ) es la probabilidad multinomial descrita anteriormente. Más detalles en la sección Materiales y métodos.

Restringir el espacio de las matrices de recuento de intervalos

En la práctica, la matriz de recuento de intervalos C no se permite que sea una matriz de valores enteros. Hay tres limitaciones naturales en la matriz de recuento de intervalos: (1) Un componente de la muestra de tumor es el genoma normal. Por lo tanto, establecemos la primera columna C1 = (2, 2,. 2) T, el vector cuyas entradas son las dos. (2) El número norte de subpoblaciones es menor que el número metro de intervalos. (3) Los números de copia de los intervalos son números enteros entre 0 y k, inclusive, donde k ≥ 2. Dejemos que C m, n, k denote el conjunto de todas las matrices que satisfacen estas propiedades.

Un algoritmo de optimización convexo

Deseamos encontrar la matriz de recuento de intervalos C ∈ C m, n, k y el vector de mezcla del genoma μ que maximizan la probabilidad multinomial PAG(r|C, μ). Sin embargo, este problema de optimización no es sencillo de resolver porque contiene ambas variables con valores enteros (entradas de C) y variables de valor real (entradas de μ). Demostramos que una transformación de coordenadas especial permite que el MLMDP se resuelva como una disyunción de problemas de optimización convexa restringida al enumerar las posibles matrices de recuento de intervalos y resolver un problema de optimización convexa separado para cada uno de ellos. C (ver Materiales y métodos). Dado que el número de matrices posibles C crece exponencialmente con metro y norte, este enfoque de estrategia de fuerza bruta no escalará mucho más allá de los pequeños valores de norte subpoblaciones y metro intervalos. En un caso especial, pero importante, en el que una muestra contiene una sola población tumoral clonal junto con una mezcla normal (es decir, norte = 2), mostramos cómo restringir aún más el espacio de posibles matrices de conteo de intervalos Cy obtener un algoritmo eficiente (tiempo polinomial en metro) para el MLMDP. El tiempo de ejecución de nuestro algoritmo depende del número de intervalos metro y número máximo de copias k en la entrada. Simulaciones con metro = 39 y k = 3 (descrito a continuación) se ejecuta en 1 a 2 minutos en un escritorio estándar, mientras aumenta a k = 5 aumenta el tiempo de ejecución a aproximadamente 25 a 40 minutos.

Seleccionar una solución

Dos cuestiones adicionales que deben abordarse al derivar una solución son: (1) cómo seleccionar entre múltiples soluciones óptimas y (2) cómo elegir el número norte de subpoblaciones tumorales en la mezcla. Observamos que los datos de secuenciación de tumores por sí solos no distinguen entre diferentes soluciones óptimas con la misma probabilidad máxima. En términos matemáticos, esto se debe a que solo el parámetro de la distribución multinomial es identificable a partir del vector de profundidad de lectura observado. r. Por tanto, no podemos distinguir entre pares (C, μ) y (C', μ') de matrices de recuento de intervalos y vectores de mezcla del genoma que dan el mismo parámetro multinomial. Nuestro algoritmo THetA tiene opciones para devolver la familia completa de soluciones óptimas o para limitar a soluciones con un número de copia de referencia de la población tumoral clonal (consulte Materiales y métodos).

En cuanto a la segunda cuestión, tenga en cuenta que la probabilidad PAG(r|C, μ) aumenta a medida que el número norte de subpoblaciones tumorales en la mezcla aumenta: de hecho, el vector de profundidad de lectura observado se puede ajustar "perfectamente" colocando cada aberración del número de copias en su propia subpoblación tumoral. Sin embargo, las mezclas con mayor norte también tienen una mayor complejidad del modelo (es decir, más parámetros). Usamos un criterio de selección de modelo basado en el criterio de información bayesiano (BIC) para seleccionar un modelo con un equilibrio entre mayor probabilidad y menor complejidad del modelo para evitar el sobreajuste.

Evaluación de genomas de cáncer simulados

Mezcla normal: genoma de cáncer único

Utilizando dos conjuntos diferentes de datos simulados, comparamos nuestro algoritmo THetA con otros tres métodos para estimar la pureza y la ploidía del tumor: ASCAT [12], ABSOLUTE [13] y CNAnorm [18]. ASCAT y ABSOLUTE estiman conjuntamente la pureza y la ploidía del tumor, y fueron diseñados originalmente para datos de matrices de SNP. Si bien ambos pueden adaptarse para ejecutarse en datos de secuenciación de ADN, no modelan formalmente este tipo de datos, como se señaló anteriormente. CNAnorm está diseñado para datos de secuenciación de ADN, pero en lugar de permitir que la pureza y la ploidía del tumor se informen entre sí, utiliza un enfoque iterativo que infiere por separado la pureza y el número de copias. En algunos casos, CNAnorm se basa en que el usuario ingrese manualmente la ploidía más abundante.

Como se señaló anteriormente, existen múltiples soluciones óptimas con la misma probabilidad máxima. CNAnorm [18] y ASCAT [12] utilizan ad hoc criterios para devolver sólo una única estimación de pureza, y ABSOLUTE [13] utiliza cariotipos de cáncer externo para seleccionar entre múltiples soluciones posibles. Para comparar THetA con estos otros métodos, debemos seleccionar un solo par (C, μ) del conjunto devuelto por THetA como una reconstrucción de muestra representativa. Para todas las simulaciones, elegimos el par (C, μ) que maximiza la longitud total de todos los intervalos genómicos en el genoma del tumor con el número de copia 2, el número de copias esperado del genoma normal para humanos. Observamos que esta decisión se aplica solo a estas simulaciones: para los datos de secuenciación reales, THetA devuelve el conjunto de todas las soluciones iguales de las que el usuario puede seleccionar una utilizando información adicional sobre la muestra en cuestión. Para obtener más detalles sobre los otros algoritmos, consulte el archivo adicional 1, secciones K y L.

Para nuestro primer conjunto de simulaciones, generamos un genoma de cáncer que consta de aberraciones en el número de copias de los brazos del cromosoma. El número de copias para cada brazo cromosómico no acrocéntrico se eligió uniformemente al azar desde el rango 0 (es decir, deleción homocigótica) hasta k & gt 2 (amplificación), hasta un número máximo de copias especificado k. Si bien los genomas de cáncer reales pueden tener un número de copias mayor que el valor máximo (k = 7) consideradas en estas simulaciones, tales amplificaciones de alta amplitud son generalmente eventos focales. Hacemos hincapié en que no es necesario utilizar todas las aberraciones del número de copias para inferir la composición del tumor, por ejemplo, si hay un número suficiente de aberraciones en el número de copias a nivel del brazo, estas pueden ser suficientes. Luego creamos una mezcla aleatoria de este genoma de cáncer y un genoma 'normal emparejado' y simulamos un vector de profundidad de lectura r para la mezcla, agregando ruido de acuerdo con el error de estimación de profundidad de lectura φ. El parámetro φ modela errores en el proceso de secuenciación y análisis, y estimamos a partir de datos de secuenciación reales que φ está en el rango de 0.01 a 0.04 (consulte el archivo adicional 1, Sección J y Figura S3). Dado que el algoritmo ASCAT utiliza datos de matriz SNP, también simulamos datos de matriz SNP de nuestra mezcla. Más detalles de las simulaciones se encuentran en el archivo adicional 1, Sección I.

La Tabla 1 muestra cómo se desempeñaron los cuatro algoritmos en los conjuntos de datos simulados con matriz de conteo de intervalo C ∈ C 39, 2, ky vector de mezcla μ y leer el error de estimación de profundidad φ = 0,03. Por cada valor de k, el número máximo de copias, se generaron 20 conjuntos de datos simulados. El porcentaje correcto C es el porcentaje de conjuntos de datos donde la matriz de recuento de intervalos inferidos C* exactamente igual a la verdadera matriz simulada C para la muestra. El error de número de copia es 1 m n - 1 C - C * 2, que es el error promedio por estimación de número de copia realizada, o por entrada en C, donde el error es la distancia euclidiana entre C y C*. El error de pureza es μ 2 - μ 2 *, que es la distancia entre la pureza del tumor verdadera y la inferida. Solo calculamos los resultados para CNAnorm donde la pureza inferida era & lt100% (hubo entre 12 y 15 ensayos para cada k). El archivo adicional 1, Figura S4 ilustra los resultados obtenidos por cada algoritmo en uno de los conjuntos de datos cuando k = 7.

Para este primer conjunto de simulaciones, encontramos que nuestro algoritmo THetA calcula tanto C y μ con mucha precisión en un rango de números de copia k. En particular, THetA supera a CNAnorm, ABSOLUTE y ASCAT a pesar de que ASCAT utiliza información adicional (frecuencias alélicas) que THetA no considera. Incluso con aberraciones en el número de copias de gran amplitud (k = 7) THetA estima en promedio la pureza del tumor dentro del 0,5% de la pureza verdadera, en comparación con el 6,9%, 10,8% y 14,9% de ASCAT, CNAnorm y ABSOLUTE respectivamente. Incluso cuando THetA no estima correctamente todos los números de copias en el genoma, estima la mayoría de los números de copias correctamente y estima correctamente el número de copias para más segmentos que los otros algoritmos (consulte el archivo adicional 1, Figura S4). Otros resultados que comparan THetA con CNAnorm para diferentes errores de estimación de profundidad de lectura se encuentran en el archivo adicional 1, Figura S5.

También comparamos THetA, CNAnorm y ABSOLUTE utilizando un segundo conjunto de mezclas simuladas de células tumorales y normales creadas con datos de secuenciación reales de una muestra de tumor de AML y una muestra normal emparejada (TCGA-AB-2965) de The Cancer Genome Atlas (TCGA) [41]. Se eligió esta muestra debido a su alta pureza (aproximadamente 95% de pureza) y la falta de aberraciones en el número de copias. Añadimos 10 variantes de número de copias de 2,5 Mb de longitud en posiciones aleatorias no superpuestas en Chr20 (excluyendo el centrómero) en el genoma del tumor. Como en el primer conjunto de simulaciones, el número de copias para cada variante se eligió uniformemente al azar desde el rango 0 (es decir, la deleción homocigótica) hasta k & gt 2 (amplificación), hasta un número máximo de copias especificado k = 5. (No ejecutamos ASCAT en estos datos simulados ya que este algoritmo fue diseñado solo para datos de microarrays). Nuevamente encontramos que THetA supera tanto a CNAnorm como a ABSOLUTE en todas las medidas (Figura 2). En particular, THetA estima la pureza de la muestra con un orden de magnitud de mayor precisión (utilizando la raíz del error cuadrático medio como una métrica de comparación como se hizo para ABSOLUTE [13]), e identifica consistentemente más aberraciones de número de copias verdaderas que los otros algoritmos a través de diferentes valores de pureza y cobertura de secuenciación. En particular, THetA identifica 7,4 y 2,2 más aberraciones en el número de copias, en promedio, que ABSOLUTE y CNAnorm, respectivamente, en todos los valores de pureza con una cobertura de secuenciación de 30x. Incluso cuando relajamos el requisito de que una aberración del número de copia debe predecirse con el número de copia correcto y, en su lugar, contamos como correcto cualquier número de copia no normal, THetA aún supera a los demás algoritmos (consulte el archivo adicional 1, Figura S7). Más detalles de las simulaciones se encuentran en el archivo adicional 1, Sección I.

Comparación de THetA con CNAnorm y ABSOLUTE en mezclas simuladas a partir de datos de secuenciación reales. (A) Comparación de pureza tumoral verdadera e inferida por THetA, CNAnorm y ABSOLUTE en mezclas simuladas de datos de secuenciación de ADN de una muestra de leucemia mieloide aguda y una muestra normal emparejada. La línea discontinua gris indica Pureza verdadera = Pureza inferida. Debajo de cada gráfico se encuentran los errores cuadráticos medios (RMSE) de cada método. (B) Comparación del número de aberraciones del número de copias predichas correctamente (definidas como una superposición recíproca del 50% en la posición y el recuento de copias integral correcto) por cada método para variar la pureza del tumor y la cobertura de la secuencia. Num TP es el número de aberraciones del número de copias positivas verdaderas predichas. En la mayoría de los casos, THetA supera tanto a CNAnorm como a ABSOLUTE. Resultados similares que cuentan las aberraciones con la posición correcta (con un 50% de superposición recíproca) pero que permiten la diferencia entre el número de copias verdadero y predicho se encuentran en el archivo adicional 1, Figura S7. RMSE: error cuadrático medio.

Mezcla de subpoblaciones tumorales

A continuación, evaluamos el rendimiento de THetA en una mezcla simulada que contiene dos subpoblaciones de células tumorales con diferentes aberraciones en el número de copias y una mezcla con células normales. Por lo tanto, había tres subpoblaciones distintas en la mezcla (norte = 3). Nuestro método para construir los datos simulados fue el mismo que para el primer conjunto de simulaciones, como se describe en la sección anterior, con un error de estimación de profundidad de lectura fijo de φ = 0.02 junto con algunos cambios menores (consulte el archivo adicional 1, Sección I).

La Tabla 2 muestra cómo se desempeñaron los tres algoritmos en los conjuntos de datos simulados con matriz de conteo de intervalos C ∈ C m, 3, 3 y vector de mezcla μ y leer el error de estimación de profundidad φ = 0,02. El porcentaje correcto C y el error de número de copias se definen como en la Tabla 1. Definimos el error de pureza como la distancia entre la fracción verdadera y la predicha de células tumorales en la muestra. Por lo tanto, el error de pureza es 1 - μ 1 - 1 - μ 1 * 2, ya que la proporción de células tumorales en la muestra es 1- μ1. Dado que CNAnorm y ABSOLUTE no pueden inferir subpoblaciones múltiples, su porcentaje es correcto C = 0, y solo enumeramos sus estimaciones de pureza. Solo calculamos los resultados para CNAnorm donde la pureza inferida era & lt100% (hubo entre 14 y 18 ensayos para cada metro).

Si bien el rendimiento de THetA fue menos preciso al estimar todos los números de copia (es decir, las entradas en C) exactamente que para el tumor con una mezcla normal (norte = 2), THetA mantiene un buen nivel de precisión ya que las estimaciones están cerca de los números de copia del intervalo real. THetA calcula correctamente en promedio el 94% de los números de copias en todas las subpoblaciones de la mezcla cuando hay metro = 12 intervalos con número de copias variable en las subpoblaciones. THetA también estima la pureza del tumor con buena precisión (dentro del 3.6% de la pureza verdadera cuando metro = 12), mientras que tanto CNAnorm como ABSOLUTE estiman gravemente la pureza del tumor en un 30,1% y un 54,7%, respectivamente. Una posible explicación de estos errores es que ambos métodos no tienen en cuenta múltiples subpoblaciones en la muestra y, por lo tanto, tienden a informar la pureza del tumor como la fracción de la muestra que representa la subpoblación más grande o como un promedio de las fracciones de todos los tumores. subpoblaciones. Por tanto, THetA recupera con éxito una mezcla compleja de dos subpoblaciones de tumores y una mezcla de células normales directamente de la profundidad de lectura observada.

Resultados de los datos de secuenciación del cáncer de mama

Analizamos los datos de secuenciación de extremos emparejados de Illumina de tres genomas de cáncer de mama y sus muestras normales coincidentes de [25]. Descargamos los datos del Archivo Europeo de Genomas y Fenomas (número de acceso EGAD00001000138). Esto incluye dos muestras que fueron secuenciadas a una profundidad de aproximadamente 40 × cobertura y una muestra, PD4120a, que fue secuenciada con aproximadamente 188 × cobertura. Usamos el algoritmo de segmentación BIC-Seq [32] para dividir los 22 autosomas en intervalos de acuerdo con la profundidad de lectura.Formamos un vector de recuento de intervalos de todos los intervalos de más de 50 kb, centrándonos en estos intervalos genómicos más largos porque su profundidad de lectura observada tendrá una variación menor (consulte el archivo adicional 1, Figura S11). La mayoría de los intervalos eliminados en este paso son relativamente cortos para las muestras analizadas. Para los dos genomas de cobertura de 40 ×, el cambio de este límite a 10 kb dio como resultado la misma partición que cuando se usó 50 kb. Para el genoma de 188 × solo quitamos de consideración nueve intervalos cuando el umbral era de 50 kb y siete cuando el umbral era de 10 kb. Los resultados de THetA son idénticos para los dos conjuntos diferentes de intervalos. Suponemos que la mayor parte del genoma del tumor no sufre aberraciones en el número de copias y, por lo tanto, el modo del vector de profundidad de lectura es una línea de base normal. Establecemos límites superior e inferior en el número de copia para cada intervalo desde esta línea de base. Para obtener más detalles, consulte el archivo adicional 1, sección N.

Tumor de mama: cobertura de secuencia 188 ×

Analizamos el tumor PD4120a secuenciado 188 × utilizando nuestro algoritmo THetA. Consideramos que la mezcla contiene una mezcla normal con una sola subpoblación tumoral (norte = 2) y una mezcla normal con dos subpoblaciones tumorales distintas (norte = 3). Esta muestra fue ampliamente anotada por [25] y por lo tanto actúa como un control positivo para THetA.

La Tabla 3 muestra la pureza del tumor y las aberraciones del número de copias identificadas por los diversos algoritmos en el genoma del cáncer de mama de cobertura 188x (muestra PD4120a). Suponiendo una sola subpoblación tumoral mezclada con células normales (norte = 2), la estimación de THetA de la pureza del tumor (65,7%) y las aberraciones del número de copias inferidas son muy cercanas a las obtenidas por CNAnorm [18] (67,2%), ASCAT (66,0%) [12] y ABSOLUTE (65%) [13 ]. Sin embargo, todas estas estimaciones son inferiores a la pureza tumoral del 70% informada por [25], que identificó una segunda subpoblación tumoral en la muestra (ver más abajo). Porque ABSOLUTE, ASCAT, CNAnorm y THetA (con norte = 2) no modelan múltiples subpoblaciones tumorales, sus purezas tumorales informadas son un promedio de la fracción de células aberrantes entre las diferentes subpoblaciones en la muestra tumoral y, por lo tanto, generalmente son más pequeñas que la estimación de la pureza tumoral obtenida cuando permitimos más de una subpoblación tumoral (vea abajo). Además, observamos que ASCAT usó información adicional (frecuencias del alelo B), mientras que THetA, CNAnorm y ABSOLUTE solo usaron la profundidad de lectura. Las aberraciones identificadas no distinguen entre las de diferentes subpoblaciones, pero incluyen varias notificadas anteriormente en el cáncer de mama [42-47]. También ejecutamos THetA usando brazos de cromosomas como intervalos, en lugar de los intervalos BIC-Seq. Utilizando brazos de cromosomas, estimamos una pureza de muestra similar del 61,7% y predijimos el mismo conjunto de aberraciones en el número de copias que con los intervalos BIC-Seq.

Asumiendo norte = 3 subpoblaciones - células normales más dos subpoblaciones distintas de células cancerosas - analizamos un subconjunto de intervalos más largos que son más informativos para el análisis del número de copias (Tabla 3). La estimación de THetA del 72% de pureza tumoral es ligeramente superior al 70% informado por [25]. Además, la estimación de THetA de la pureza del tumor es más alta que la pureza del tumor de aproximadamente el 65% al ​​67% dada anteriormente para ABSOLUTE, ASCAT y CNAnorm, tres métodos que suponen solo una subpoblación de tumores. Nuestra selección del modelo BIC eligió esta solución como una mejor representación de los datos (Figura 3A), que la solución que solo considera una mezcla de células normales y una única población tumoral. Utilizando el norte = 3, identificamos todas las variantes del número de copias identificadas anteriormente para una sola población tumoral, más algunas aberraciones adicionales, incluidas las deleciones subclonales de los cromosomas 8, 11, 12, 14 y 15 no identificadas bajo ese modelo (ni por los otros algoritmos). Esto demuestra la capacidad de THetA para identificar aberraciones en el número de copias en subpoblaciones de células. Si bien muchas de las aberraciones clonales y subclonales del número de copias encontradas por THetA son idénticas a las informadas por [25], existen varias diferencias notables que incluyen: una deleción clonal de 16q y una clasificación diferente de las aberraciones en los cromosomas 1 y 22 como clonales frente a subclonales. . La Tabla 3 muestra el conjunto completo de diferencias donde las aberraciones en negrita indican una diferencia entre nuestras predicciones y las informadas por [25]. Las aberraciones informadas por [25] incluyen varios cromosomas no considerados como parte de nuestro análisis (2, 6, 7, 9, 18 y 21). En la Tabla 3, las aberraciones en cursiva no se ingresaron norte = 3 análisis de THetA, y se infirieron mediante el examen de las relaciones de profundidad de lectura corregidas para la mezcla normal y las fracciones de células tumorales derivadas de THetA (consulte el archivo adicional 1, sección Q).

Análisis del tumor de mama de cobertura 188 × PD4120a. (A) (Izquierda) Lea las relaciones de profundidad (gris) y las aberraciones del número de copias inferidas por nuestro algoritmo cuando norte = 3 incluyendo la población normal (negro), la población tumoral dominante (clonal) (azul) y la población tumoral subclonal (rojo). (Derecha) Una reconstrucción de la mezcla tumoral con las aberraciones inferidas y la fracción estimada de células en cada subpoblación. (B) Lea las relaciones de profundidad en intervalos de 50 kb después de centrar para que el cromosoma 3 tenga una media de 1 y corrija el 28% de la mezcla normal utilizando una escala lineal simple. (C) Los resultados de la matriz de SNP virtuales muestran distintos grupos de regiones de acuerdo con el número de lecturas que contienen cada SNP y la fracción de lecturas que respaldan el alelo variante. (D) Datos de matriz de SNP virtuales que comparan fracciones de alelos variantes y recuentos de lectura para los cromosomas 4 y 16. Estos datos demuestran que ambos cromosomas han sufrido el mismo tipo de aberración del número de copias, que predijimos que sería una deleción clonal en el 72% de las células de la muestra. (MI) Datos de la matriz de SNP virtuales para los cromosomas 13 y 22. El cromosoma 22q11.2-12.1 y el cromosoma 13 parecen estar afectados por el mismo tipo de aberración, que predijimos que sería una deleción subclonal en el 61,9% de las células de la muestra. En contraste, 22q12.2-13.3 es diferente y los datos son consistentes con una deleción clonal. Consulte el archivo adicional 1, Figura S13 para obtener más detalles.

Investigamos más las siguientes tres diferencias entre nuestro análisis y [25]: (1) deleción clonal del cromosoma 16q, (2) amplificación clonal versus subclonal del cromosoma 1q y (3) deleciones clonales versus subclonales en el cromosoma 22q. Analizamos estas diferencias utilizando dos enfoques complementarios. Primero, analizamos la distribución de las relaciones de profundidad de lectura normal / tumor en contenedores de 50 kb en todo el genoma. Esta distribución contiene picos distintos correspondientes a las aberraciones del número de copias que ocurren en diferentes subpoblaciones. Después de corregir las proporciones de profundidad de lectura para una mezcla normal utilizando una escala lineal (consulte el archivo adicional 1, Sección O), los picos correspondientes a las aberraciones clonales se producirán en proporciones divisibles por 0,5, mientras que los picos correspondientes a las aberraciones subclonales no lo harán (Figura 3B). En segundo lugar, analizamos una matriz de SNP virtual que construimos a partir de los recuentos de lecturas y las frecuencias de alelos variantes derivadas de lecturas alineadas en SNP de línea germinal conocidos (consulte Materiales y métodos). Las aberraciones del número de copias que ocurren en diferentes subpoblaciones aparecen como grupos distintos en un gráfico de dispersión del recuento de lecturas frente a las frecuencias de alelos variantes (Figura 3C).

La primera diferencia que analizamos fue nuestra predicción de una deleción clonal del cromosoma 16q, que no fue informada por [25]. La inspección visual de los datos de la matriz SNP virtual para el cromosoma 4 (que se predice que será una deleción clonal por ambos métodos) y el cromosoma 16q muestra tres grupos distintos: uno para las regiones de copia normal (centrado en una frecuencia de alelos variante de 0,5) y dos grupos ( posicionado simétricamente alrededor de una frecuencia alélica variante de 0.5) con un recuento de lectura más bajo que indica una deleción (Figura 3D). Estos grupos de deleciones tienen ubicaciones prácticamente idénticas en el gráfico de dispersión de los cromosomas 4 y 16q, lo que respalda la conclusión de que estas deleciones ocurren en la misma fracción de la muestra del tumor. La comparación de la diferencia entre las proporciones de profundidad de lectura observadas y esperadas en estas deleciones para diferentes fracciones de aberración (el porcentaje de la muestra que contiene la aberración) revela que la fracción de aberración óptima para ambas deleciones es muy similar: evidencia adicional de que estas deleciones ocurren en la misma fracción de la muestra de tumor (consulte el archivo adicional 1, la sección Q y la figura S12). Dada la fuerte evidencia de esta deleción del cromosoma 16, sospechamos que su omisión de [25] fue un descuido más que una deficiencia del análisis.

La segunda diferencia es que predijimos que el cromosoma 1q se amplificaría en una población subclonal que constaba del 61,9% de las células de la muestra, mientras que [25] indicó que esta aberración es clonal (que ocurre en el 70% de las células de la muestra). Dado que esta fue la única gran amplificación presente en la muestra, no pudimos comparar sus frecuencias alélicas variantes con una amplificación diferente (como hicimos con los cromosomas 4 y 16 anteriores). Por lo tanto, examinamos los datos de profundidad de lectura más de cerca. La inspección visual de las relaciones de profundidad de lectura después de ajustar nuestra mezcla normal prevista del 28% (Figura 3B) y la mezcla normal al 30% prevista por [25] (consulte el archivo adicional 1, Figura S11) muestra que las relaciones de profundidad de lectura corregidas para el cromosoma 1q no no coincide con una proporción de 1,5 pocillos (como se esperaría si hubiera una amplificación clonal con la copia número 3), una indicación de que 1q es una aberración subclonal. La comparación de las relaciones de profundidad de lectura para 1q con otras aberraciones clonales respalda nuestra predicción de que 1q es una deleción subclonal (consulte el archivo adicional 1, Figura S12).

La diferencia final involucra al cromosoma 22q, predijimos que contiene deleciones tanto clonales como subclonales, mientras que [25] solo informó eventos subclonales. En particular, [25] informó que una deleción de un cromosoma derivado de una translocación entre los cromosomas 1 y 22 es el reordenamiento responsable de la deleción subclonal observada en 22q. Encontramos que 1p (ver archivo adicional 1, Figura S12) y la porción distal de 22q (bandas citogenéticas 12.2-13.3) parecen ser deleciones clonales, mientras que la porción proximal de 22q (bandas citogenéticas 11.2-12.1) es una deleción subclonal. En particular, el gráfico de profundidad de lectura / alelo variante de la matriz virtual de SNP muestra un grupo oblongo para el cromosoma 22 que solo se superpone parcialmente con el grupo del cromosoma 13, un cromosoma que se predice por ambos métodos que ha sufrido una deleción subclonal (Figura 3E ). Esta evidencia apoya otra posible secuencia de reordenamientos: (1) Se produjo una translocación no recíproca entre los cromosomas 1 y 22 (respaldada por la salida del algoritmo GASV [48] para la agrupación de lecturas discordantes como se describe en el archivo adicional 1, Sección Q) resultando en la pérdida clonal de 1p y 22q12.2-13.3. Después de esta translocación, quedaron dos copias de 22q11.2-12.1. (2) Una de estas dos copias restantes de 22q11.2-12.1 se eliminó en una población subclonal (consulte el archivo adicional 1, Figura S13).

Tumor de mama: 40 × cobertura de secuencia

También analizamos dos muestras de tumores de [25] secuenciadas con una cobertura de aproximadamente 40 ×. Para la muestra PD4088a, el modelo de esta mezcla preferido por nuestro procedimiento de selección de modelo fue una población tumoral clonal única con una fracción de mezcla normal del 41%. [25] también informó esta muestra como clonal, aunque no proporcionaron una estimación de la pureza del tumor o aberraciones en el número de copias. Más detalles del análisis de esta muestra se encuentran en el archivo adicional 1, Sección S y Figura S16.

Analizamos la muestra PD4115a, secuenciada a aproximadamente 40 × cobertura usando THetA, nuevamente considerando el caso donde la mezcla contiene una mezcla normal con una sola subpoblación tumoral (norte = 2) y una mezcla normal con dos subpoblaciones tumorales distintas (norte = 3). Nuestra selección de modelo BIC eligió el modelo donde la muestra es una mezcla de células normales y dos subpoblaciones distintas de células tumorales (Figura 4A) sobre el modelo donde la muestra contiene una sola subpoblación tumoral con una mezcla normal. Si bien [25] proporcionó algún análisis de las aberraciones en este ejemplo, no proporcionaron un historial tumoral completo como lo hicieron para el genoma de cobertura 188 ×. La información completa de nuestro análisis de esta muestra, cuando la consideramos como una mezcla de una sola subpoblación de tumores junto con una mezcla normal, se encuentra en el archivo adicional 1, sección R y figura S14. Para el modelo que considera subpoblaciones de tumores múltiples, analizamos un subconjunto de intervalos más largos que son más informativos para el análisis del número de copias (más detalles en Materiales y métodos). Estimamos una mezcla normal de 24% (pureza tumoral 76%) y dos subpoblaciones tumorales de 43,3% y 32,7%. La presencia de estas poblaciones subclonales es evidente a partir de la inspección visual de las proporciones de profundidad de lectura corregidas después de centrar la distribución (las proporciones en el cromosoma 20, que se predice que no contiene aberraciones en el número de copias, se traducen para tener una proporción media de 1) y la corrección para un mezcla normal (Figura 4B). En particular, un pico grande cerca de una proporción corregida de 0,5 representa deleciones clonales (Figura 4C). Además, aparecen dos picos más pequeños superpuestos pero distintos entre las deleciones clonales y las regiones de copia normal (Figura 4D y 4E). Estos picos representan dos poblaciones subclonales distintas en la muestra de tumor. Una prueba estadística de la diferencia en las relaciones de profundidad de lectura entre estos picos apoya la conclusión de que estas poblaciones subclonales son de hecho distintas (consulte el archivo adicional 1, Figura S15).

Análisis del tumor de mama de cobertura 40 × PD4115a. (A) (Izquierda) Lea las relaciones de profundidad (gris) y las aberraciones del número de copias inferidas calculadas por nuestro algoritmo cuando norte = 3 incluyendo la población normal (negro), la población tumoral dominante (clonal) (azul) y la población tumoral subclonal (rojo). (Derecha) Una reconstrucción de la mezcla tumoral con las aberraciones inferidas y la fracción estimada de células en cada subpoblación. (B) Distribución de las relaciones de profundidad de lectura en intervalos de 50 kb después del centrado y corrección para una mezcla normal al 24% utilizando una escala lineal simple. Varios picos caen cerca de las proporciones corregidas esperadas (0.5, 1, 1.5, 2). Se pueden ver dos picos superpuestos pero distintos que indican múltiples deleciones subclonales en proporciones similares (etiquetadas como D y E). (C) (Arriba) Lea las proporciones de profundidad en contenedores de 50 kb para los cromosomas 5, 9 y 11, cada uno de los cuales tiene una deleción clonal (púrpura). (Abajo) Distribución de las relaciones de profundidad de lectura después de la corrección de la fracción de aberración del 76% de la muestra. (D) (Arriba) Lea las relaciones de profundidad en contenedores de 50 kb para los cromosomas 3, 4 y 5, cada uno de los cuales tiene una deleción subclonal (azul). (Abajo) Distribución de las relaciones de profundidad de lectura después de la corrección de la fracción de aberración del 43,3% de la muestra. (MI) (Arriba) Lea las relaciones de profundidad como en (D), pero se resalta (rojo) una deleción subclonal diferente. (Abajo) Distribución de las relaciones de profundidad de lectura después de la corrección de la fracción de aberración del 32,7% de la muestra.

El análisis de la matriz de SNP virtual de esta muestra fue difícil debido a la menor cobertura de secuencia. Esto conduce a grupos superpuestos en la gráfica de recuento de lecturas / alelos variantes, así como a bandas distintas que resultan de la integralidad de los recuentos de lectura (Figura 5A). Los únicos grupos claramente diferenciados son para regiones altamente amplificadas, que tienen un recuento de lecturas correspondientemente más alto. Dado que nuestro análisis para este modelo usó solo un subconjunto de intervalos cromosómicos para inferir mezclas normales y subpoblaciones tumorales, pudimos usar el vector de mezcla del genoma resultante para analizar otros cromosomas que no se usaron para calcular la solución de máxima verosimilitud. Analizamos varias regiones en el cromosoma 8 (Figura 5B), un cromosoma con un patrón de amplificación complicado. Después de corregir las proporciones de profundidad de lectura en intervalos de 50 kb en esta región para la mezcla normal estimada del 24%, aparecieron tres picos distintos centrados cerca de las proporciones de 1, 1,5 y 2, correspondientes a números enteros de copias de 2, 3 y 4, respectivamente. en la muestra de tumor (Figura 5C). Las amplificaciones son aberraciones clonales. Curiosamente, las frecuencias alélicas variantes para los SNP de la línea germinal en las regiones correspondientes al pico en la proporción corregida 2 (copia número 4) se centran en 0,5. Esto implica que ambos homólogos de chr8q13-21 están presentes en el mismo número de copias en esta región, es decir, hay una duplicación de ambos homólogos (Figura 5D). Además, observamos que las frecuencias alélicas variantes para el cromosoma 8p están centradas en los valores de 0 y 1, aunque se infiere que este segmento del cromosoma tiene copia número 2. Esto indica que hubo una pérdida de heterocigosidad de copia neutral ( LOH) en esta región. La LOH en 8p se ha informado anteriormente en el cáncer de mama [49, 50] y se ha informado de LOH neutral con copia en 8p en datos de líneas celulares para otros cánceres [51].

Análisis del cromosoma 8 en la muestra PD4115a. (A) Los datos de la matriz de SNP virtuales de esta muestra muestran pocos grupos distintos (en comparación con la muestra de 188 × en la Figura 3A), siendo la amplificación del cromosoma 8 (verde) la más prominente. (B) Lea las proporciones de profundidad del cromosoma 8 organizadas por coordenadas genómicas. (C) Histogramas de relaciones de profundidad de lectura para el cromosoma 8 corregidos para una mezcla normal al 24%, indicando regiones de copias números 2, 3 y 4 (cian, naranja y rosa), siendo las dos últimas amplificaciones clonales. (D) Frecuencias de alelos variantes para el cromosoma 8. La región con la copia número 4 (rosa) tiene frecuencias de alelos variantes agrupadas alrededor de 0.5, lo que sugiere la duplicación de ambos homólogos cromosómicos, mientras que la región telomérica con la copia número 2 (cian) tiene una pérdida de heterocigosidad, lo que sugiere una copiar evento LOH neutral. LOH: pérdida de heterocigosidad


Oncología de precisión: ¿quién, cómo, qué, cuándo y cuándo no?

Las divulgaciones de posibles conflictos de intereses proporcionadas por los autores están disponibles con el artículo en línea en asco.org/edbook.

Abstracto

La oncología de precisión, definida como el perfil molecular de los tumores para identificar alteraciones dirigibles, se está desarrollando rápidamente y ha entrado en la corriente principal de la práctica clínica. Las pruebas genómicas involucran a muchas partes interesadas que trabajan de manera coordinada para entregar muestras de tejido de alta calidad a laboratorios de alta calidad, donde el análisis molecular de secuenciación de próxima generación (NGS) apropiado conduce a resultados procesables. Los médicos deben estar familiarizados con los tipos de variantes genómicas informadas por el laboratorio y la tecnología utilizada para determinar los resultados, incluidas las limitaciones de las metodologías e informes de prueba actuales. La interpretación de los resultados genómicos se realiza mejor con aportaciones multidisciplinarias para reducir la incertidumbre en las recomendaciones clínicas relacionadas con una variante documentada.El cáncer de pulmón de células no pequeñas ha surgido como un prototipo de enfermedad en el que los datos genómicos de al menos varias alteraciones bien documentadas con agentes dirigidos aprobados son esenciales para el tratamiento óptimo desde el diagnóstico de enfermedad avanzada. Debido al desarrollo de resistencia a las terapias dirigidas, el remuestreo y la reevaluación de los tumores, incluido el uso de tecnología de biopsia líquida después de la progresión clínica, pueden ser importantes para tomar decisiones sobre el tratamiento. El valor del perfil molecular depende de evitar tanto la subutilización de pares variantes de fármaco diana bien documentados como la sobreutilización de la terapia variante de fármaco sin beneficio comprobado. A medida que las técnicas evolucionan y se vuelven más rentables, el uso de pruebas moleculares puede resultar para agregar más especificidad y mejorar los resultados para un mayor número de pacientes.

El objetivo de la oncología de precisión ha comenzado a realizarse mediante pruebas moleculares multiplex que incluyen NGS.

Los oncólogos deben estar familiarizados con los aspectos técnicos de NGS para facilitar la selección de la plataforma de pruebas más adecuada y rentable.

Las consideraciones para las pruebas moleculares incluyen qué tipo de tejido utilizar, momento del perfil en el curso de la enfermedad, extensión del panel para ordenar y grado de anotación clínica informada.

Los biomarcadores procesables del cáncer de pulmón de células no pequeñas hacen de esta enfermedad un paradigma de la oncología de precisión en el momento del diagnóstico de la enfermedad avanzada, durante la terapia y en el momento de la progresión.

La interpretación de datos moleculares para facilitar las mejores prácticas sigue siendo un desafío. Se recomienda encarecidamente la participación en ensayos clínicos y el intercambio de conjuntos de datos clínicos / moleculares vinculados.

El objetivo de la medicina de precisión es simplemente administrar el tratamiento correcto contra el cáncer al paciente correcto en la dosis correcta y en el momento correcto. Varias líneas de investigación se unieron casi simultáneamente para marcar el comienzo de la era de la oncología de precisión. En 1998, el BCR-ABL El reordenamiento en la leucemia mieloide crónica fue abordado con éxito por la molécula pequeña imatinib, lo que provocó remisiones clínicas dramáticas y la aprobación de la Administración de Drogas y Alimentos de los EE. UU. en 2001. El primer borrador de secuencia del genoma humano se logró el mismo año, 1 seguido por el primer genoma del cáncer . 2 El rápido descubrimiento de múltiples mutaciones impulsoras no superpuestas e inhibidores de la tirosina quinasa con propiedades inhibidoras clínicamente efectivas en el cáncer de pulmón de células no pequeñas y el melanoma condujo a ensayos de alteraciones realizados por reacción en cadena de la polimerasa (PCR) de forma rápida y económica. El uso de estos biomarcadores para impulsar las decisiones de tratamiento en tumores sólidos generó expectativas e interés en el perfil molecular. La tecnología de secuenciación y los costos mejoraron rápidamente a principios de la década de 2000, particularmente con el advenimiento de NGS en tejido fijado con formalina e incluido en parafina, mediante el cual la secuenciación paralela masiva permite la determinación de alteraciones en una gran cantidad de genes a través de un proceso oportuno y rentable.

La oncología de precisión sustenta el concepto de mutaciones somáticas como base del desarrollo del cáncer. 3 Las mutaciones en los oncogenes que los hacen constitutivamente activos se consideran mutaciones impulsoras y son puntos de control centrales para la progresión de las neoplasias malignas. Por el contrario, los genes supresores de tumores, que participan de forma natural en el control de la patogénesis del tumor, pueden provocar la progresión del cáncer cuando se inactivan mediante mutación o pérdida de alelos. Múltiples procesos dan como resultado una desregulación de la maquinaria genética en el ADN, el ARN o la proteína, lo que conduce a una expresión alterada de la proteína codificada por el gen. Para capturar el espectro completo de alteraciones potenciales, es mejor considerar múltiples tecnologías, denominadas enfoque múltiple o panómico. La gran cantidad de opciones de tecnologías, entidades comerciales que ofrecen pruebas y, a veces, resultados contradictorios han abrumado a los médicos que buscan obtener información molecular que resultará en una utilidad clínica para sus pacientes. Incluso en los centros académicos, los oncólogos informan de una confianza variable en su capacidad para utilizar los hallazgos genómicos de manera adecuada. 4

En su nivel más fundamental, una prueba genómica con utilidad clínica debe predecir la respuesta al tratamiento de un agente objetivo. Un ejemplo temprano en oncología de tumores sólidos fue la capacidad de realizar pruebas para HER2 positividad definida como amplificación génica fluorescente basada en hibridación in situ o inmunohistoquímica para demostrar la sobreexpresión de la proteína. Los resultados positivos predijeron la respuesta a las terapias basadas en trastuzumab, mientras que HER2Los tumores negativos no se beneficiaron de este enfoque. A medida que nos hemos trasladado a la prueba múltiple de muchos genes u otras especies biológicas, incluidos el ARN mensajero y las proteínas, se deben aplicar los mismos criterios: ¿la alteración variante es suficientemente predictiva de la respuesta a un agente emparejado?

Hasta la fecha, el éxito en el uso de enfoques de tratamiento de precisión ha sido desigual. Un estudio prospectivo de fase II de perfiles moleculares para asignar una terapia emparejada no mostró resultados superiores para el grupo emparejado, pero sufrió serios problemas de diseño metodológico. 5 Grandes series retrospectivas han documentado que 80% -90% de los pacientes evaluados tendrán alteraciones genómicas potencialmente procesables, aunque la definición de procesable puede variar sustancialmente. 6 -9 Sin embargo, hasta la fecha solo una minoría de pacientes recibe realmente terapia dirigida genómicamente, generalmente en un ensayo clínico.

Se puede determinar una variedad de variantes somáticas genómicas con NGS, incluidas las variantes de un solo nucleótido (SNV), también conocidas como mutaciones puntuales, y pequeñas inserciones o deleciones de bases (indeles), que pueden dar lugar a una proteína no funcional o ausente. Además, se pueden detectar variantes del número de copias, que reflejan amplificaciones y deleciones de genes y / o porciones más grandes de un cromosoma, reordenamientos de genes y genes de fusión.

Este criterio se refiere al número de veces que se lee una posición de base particular en el ADN durante el análisis NGS. Cuanto mayor sea la cobertura de una alteración en particular, mayor será la probabilidad de que se detecte, lo que es especialmente importante en muestras tumorales con bajo contenido tumoral. Al cubrir la misma área del fragmento del gen varias veces, aumenta la probabilidad de captar una variación de baja frecuencia alélica. Para las pruebas de puntos calientes, se recomienda una cobertura de al menos 100–300X.

Cuántos genes están incluidos y qué áreas del gen se analizan. Las ofertas de NGS más frecuentes en la actualidad son las pruebas de puntos calientes, donde se analizan las alteraciones en los exones o en las áreas de unión intrón / exón de un panel preseleccionado de genes de cáncer, incluidos oncogenes activadores conocidos y genes supresores de tumores. Los paneles de puntos calientes específicos se centran en los genes del cáncer mejor anotados, por lo general de 35 a 350 genes, y brindan una gran profundidad de cobertura. La mayor profundidad permite evaluar la frecuencia de alelos más baja y puede explicar la heterogeneidad intratumoral y la baja frecuencia de alelos de la alteración. Los paneles NGS no son ideales para reordenamientos y / o deleciones a gran escala y ciertos genes de fusión. La adición de secuenciación de ARN puede ayudar a identificar estas alteraciones.

Recientemente, la secuenciación del exoma completo y la secuenciación del transcriptoma completo están disponibles en laboratorios académicos y algunos comerciales. Por el momento, el valor de la información de secuenciación del exoma completo se limita en gran medida al espacio de la investigación traslacional, donde ofrece un enorme potencial para producir nuevas asociaciones patógenas-variantes que conduzcan a ensayos clínicos que investiguen nuevos agentes. El tiempo de respuesta prolongado y la falta de asociaciones clínicas para la gran mayoría de las alteraciones genómicas impiden el uso clínico efectivo actual.

El enfoque bioinformático para alinear la gran cantidad de información obtenida en una secuencia NGS y llamar con precisión las variantes es importante para lograr resultados de calidad. Se generan puntuaciones de calidad variantes para cada prueba dentro de un laboratorio. Los resultados de validez técnica se pueden proporcionar al médico a pedido y pueden ser útiles para determinar qué ensayo usar debido a diferencias entre laboratorios. Actualmente, no existen pautas federales de validez técnica para las pruebas NGS, que se clasifican como pruebas desarrolladas en laboratorio.

Esto refleja el porcentaje de lecturas que identifican una variante dividido por la cobertura general de ese locus. Si las células tumorales representan el 100% de la muestra de ADN analizada, los loci heterocigotos, como los observados en las mutaciones de la línea germinal, deben estar cerca del 50% de la frecuencia de alelos variantes, los loci homocigotos deben estar cerca del 100% y los loci de referencia deben estar cerca de cero. En la práctica real, la contaminación por células normales, las alteraciones del número de copias locales y la heterogeneidad tumoral a menudo producen una frecuencia de alelos variante impredecible.

Particularmente para las variantes de un solo nucleótido, no siempre es fácil determinar si una mutación es patógena o no. Las bases de datos disponibles públicamente, como el Catálogo de Mutaciones Somáticas en Cáncer (COSMIC), 10 y las bases de datos internas del laboratorio, son revisadas por el patólogo evaluador y se determina si la alteración es patógena, probablemente patógena, probablemente benigna (lo que significa que es probable que sea un polimorfismo de un solo nucleótido sin importancia funcional), benigno que representa un polimorfismo de un solo nucleótido conocido o una variante de significado desconocido. A medida que las pruebas de panel se hacen más grandes, la notificación de una variante de importancia desconocida ha aumentado de manera espectacular. Se espera que en el futuro, el intercambio de datos genómicos resuelva el problema del creciente número de alteraciones sin un correlato clínico para llamar patógeno o no. Por el momento, es extremadamente importante utilizar un laboratorio con una profunda experiencia molecular, incluidos patólogos moleculares y genetistas en el personal para ayudar a realizar la llamada. Alternativamente, organizaciones de terceros como N-of-1 utilizan amplias capacidades de recursos para realizar esta función para laboratorios o sistemas de atención médica. Su función es generar contenido relevante para el espectro de variantes para que se puedan tomar decisiones clínicamente apropiadas.

Cuando se prueba un tumor solo, las variantes se comparan con bases de datos como COSMIC y ClinVar 11 para determinar si la variante es una variante patogénica conocida o un polimorfismo de un solo nucleótido conocido. La secuenciación simultánea del tumor y el tejido normal permite una llamada más precisa de mutaciones somáticas. Además, los genes de predisposición al cáncer de línea germinal se pueden distinguir claramente de las mutaciones somáticas en los mismos genes. A medida que la bioinformática mejora, el valor del costo adicional y la complejidad de secuenciar tanto el tumor como el tejido normal parece estar disminuyendo de forma rutinaria. 12 Aunque los avances en las técnicas bioinformáticas y las bases de datos de línea germinal de referencia están mejorando la precisión de la secuenciación solo de tumores, la secuenciación de tumores emparejados y de tejidos normales sigue siendo el estándar de oro para la detección de mutaciones somáticas.

Hacer oncología de precisión de manera óptima depende de resolver correctamente los problemas operativos de las pruebas. Hay muchas consideraciones que influyen en la selección de la prueba molecular correcta (Recuadro 1). La comunicación entre médicos oncólogos y patólogos locales se vuelve más crítica que nunca, particularmente cuando el material se enviará a una instalación externa. Los patólogos locales controlan el tejido y se deben establecer claramente la justificación de las pruebas y las necesidades técnicas del laboratorio externo. Los procedimientos operativos estándar para las pruebas moleculares son útiles para facilitar el proceso y mejorar la probabilidad de informes de resultados moleculares oportunos, exitosos y precisos. Es importante destacar que los bloques de tejido deben evaluarse en busca de tejido tumoral adecuado para que los resultados sean interpretables y se puedan caracterizar las mutaciones poco frecuentes. Las muestras fijadas con formalina e incluidas en parafina, incluidos los aspirados con aguja fina y las muestras de citología con suficiente celularidad, se pueden utilizar para NGS. La cantidad de ADN necesaria, expresada en nanogramos o el número de portaobjetos necesarios para realizar la prueba, debe considerarse desde el principio para evitar un resultado de cantidad insuficiente. La tecnología NGS requiere al menos de 10 a 20 portaobjetos para un análisis completo, por lo que es posible que el patólogo tenga que evaluar varios bloques para tomar la muestra con la mayor cantidad de tejido tumoral que probablemente dé un resultado interpretable.

Elección de ensayo y diseño

Enmiendas de mejora de laboratorio clínico y / o certificación del Colegio de Patólogos Estadounidenses

Muchos pacientes se someten a aspiración con aguja fina o biopsias centrales para el diagnóstico histológico de malignidad, por lo que el tejido remanente puede ser escaso y es esencial tomar decisiones cuidadosas sopesando los riesgos y beneficios de la biopsia con el propósito expreso de las pruebas genómicas. Para los pacientes que probablemente requieran pruebas moleculares en algún momento de su curso, es útil planificar la biopsia inicial de la enfermedad metastásica teniendo en cuenta esta necesidad, de modo que el tejido esté disponible más adelante. Las decisiones de realizar una nueva biopsia son complejas e incluyen la morbilidad y el costo asociados con el procedimiento frente al valor de evaluar la biología actual del tumor, particularmente después de la exposición a agentes que alteran la genómica.

Por lo general, no se requiere el consentimiento informado específico para las pruebas en el contexto de la toma de decisiones clínicas para el perfil molecular. El formulario de consentimiento general de una clínica de oncología para las pruebas y el tratamiento debe cubrir las pruebas moleculares en el ámbito de la práctica médica. Si los resultados de los pacientes se utilizarán en un registro prospectivo mantenido por la práctica, la institución, el laboratorio de pruebas o un consorcio académico, se recomienda el consentimiento informado basado en un protocolo de recolección y análisis. Si las alteraciones moleculares hacen que un paciente sea elegible para un ensayo clínico, se le pedirá al paciente que vuelva a dar su consentimiento para utilizar esta información para el estudio.

Muchos pacientes con enfermedad metastásica pueden ser buenos candidatos para pruebas genómicas en diferentes momentos de su curso clínico. Los pacientes con enfermedad con menos o ninguna opción de tratamiento estándar son candidatos para el perfil molecular temprano con la esperanza de ser candidatos para un ensayo clínico que evalúe una alteración en particular. Dichos ensayos se denominan estudios de cesta y, por lo general, son independientes del tejido de origen siempre que se identifiquen variantes específicas. Cuando no hay ningún ensayo disponible o el paciente no es elegible, el uso de un agente aprobado para una alteración específica en otro estado de la enfermedad (p. Ej., Mutación BRAF V600E) puede ser apropiado después del fracaso de la terapia estándar. A menudo, no hay datos de ensayos definitivos para basar las decisiones sobre la idoneidad de la terapia dirigida molecular en entornos que no son de investigación, y se debe sopesar cuidadosamente un equilibrio de riesgos y beneficios de un enfoque desconocido. En la Tabla 1 se presenta una jerarquía potencial para la toma de decisiones. La evidencia emergente sugiere que la carga mutacional del tumor general, analizada en grandes paneles de genes diana de 300 a 600 genes o utilizando la secuenciación del exoma completo, puede predecir la respuesta a los inhibidores de puntos de control inmunitarios. 13,14 Además, la evaluación de la deficiencia de reparación de desajustes a través del análisis genómico es otro ensayo molecular valioso con aplicabilidad a las terapias inmuno-oncológicas. 15

TABLA 1. Bases de conocimientos en línea para ayudar a la toma de decisiones clínicas

En general, los pacientes en etapa temprana que se someten a un tratamiento definitivo no suelen requerir paneles de genes somáticos. No tendrán alteraciones procesables proporcionadas por NGS más allá de lo que se puede determinar a partir de la evaluación histológica estándar (p. Ej., Receptor de estrógeno, receptor de progesterona y HER2 en el caso de cáncer de mama en estadio temprano). La información molecular más amplia será de uso exclusivo para la investigación.

Para ciertas enfermedades en las que una decisión de primera línea depende de múltiples marcadores moleculares, como el cáncer de pulmón de células no pequeñas avanzado, el uso de un panel de NGS múltiple en el momento del diagnóstico se vuelve cada vez más atractivo dado el creciente número de genes diana, la capacidad de obtener simultáneamente la información de una muestra y el costo cada vez más bajo de las pruebas multiplex. Por el contrario, cuando otros estados de enfermedad agotan las líneas de terapia estándar basadas en la evidencia, las pruebas de panel suelen ser apropiadas si el paciente sigue siendo un buen candidato para un tratamiento adicional.

Se debe decidir si enviar una nueva biopsia o utilizar tejido de archivo. Pueden observarse resultados genómicos discordantes entre los tumores primarios y las metástasis, aunque esto es muy específico del sitio de la enfermedad. Por ejemplo, RAS las mutaciones en el cáncer colorrectal son un evento temprano en la tumorigénesis, y se puede obtener información confiable y procesable con respecto al uso de anticuerpos anti-EGFR en el entorno metastásico del tumor primario. 16 Por el contrario, las mutaciones del receptor de estrógeno 1 que confieren resistencia a los inhibidores de la aromatasa en el cáncer de mama parecen ocurrir como consecuencia de la exposición a los inhibidores de la aromatasa y es poco probable que estén presentes en el tumor primario. 17

La evolución molecular del tumor se ha documentado en muchos cánceres bajo la presión selectiva de la terapia previa. Esto es más evidente en pacientes que reciben terapia dirigida en la que uno de los mecanismos de resistencia son mutaciones secundarias en el gen de interés o en la ruta relevante. 18 En estas circunstancias, la repetición de biopsias puede ser muy informativa. Actualmente, el grado de heterogeneidad que presentan las lesiones metastásicas en varios sitios no está claro. Cuando se sospecha heterogeneidad, las biopsias líquidas para el ADN tumoral circulante o las células tumorales circulantes pueden reflejar mejor la situación clínica, presumiblemente integrando el estado del tumor de una variedad de sitios y reflejando un panorama mutacional compuesto. 19 Este concepto es atractivo pero está lejos de estar establecido y requiere más estudio. Sin embargo, es probable que el muestreo de tejido invasivo mínimo utilizando muestras de sangre para producir componentes como el ADN tumoral circulante y las células tumorales circulantes se convierta en una alternativa a la biopsia en situaciones de riesgo clínico y en el seguimiento de las alteraciones progresivas del tumor durante la exposición a agentes específicos.

A medida que se expande la oncología de precisión, existe una necesidad cada vez mayor de incluir expertos en múltiples dominios en la toma de decisiones para aprovechar mejor la enorme cantidad de información de manera inteligente. En el entorno comunitario donde los oncólogos generalistas ahora tienen que agregar el manejo de datos genómicos a la información clínica, tener acceso a experiencia adicional es enormemente valioso. Se pueden realizar juntas de tumores moleculares virtuales o en tiempo real en un entorno de práctica. Idealmente, los miembros incluirían oncólogos médicos, quirúrgicos y radioterapeutas, como se encontraría en cualquier panel de tumores convencional complementado por patólogos, asesores genéticos y personal de investigación. A menudo, los laboratorios comerciales disponen de experiencia adicional en forma de patólogos moleculares y genetistas moleculares. En entornos de práctica más sólidos, el acceso a bioestadísticos, bioinformáticos, epidemiólogos y científicos traslacionales puede estar disponible para participar.Varias bases de datos están disponibles públicamente para realizar búsquedas en los foros de tumores moleculares para ayudar a establecer asociaciones de terapias variantes. Varios sitios web gratuitos, actualizados con frecuencia y cuidadosamente seleccionados ofrecen información sobre una gran cantidad de variantes y pueden ser muy útiles para el médico en ejercicio para ayudar a determinar si una terapia en particular es adecuada para un paciente (Tabla 2). Los tableros de tumores moleculares archivados en línea, como los proporcionados por ASCO, son una buena fuente de referencia. 20

TABLA 2. Medicamentos aprobados por la Administración de Alimentos y Medicamentos de EE. UU. Y diagnósticos complementarios o complementarios para el cáncer de pulmón de células no pequeñas

La integración de datos moleculares en los historiales médicos electrónicos se encuentra en una etapa incipiente. Por lo general, los resultados genómicos se envían al oncólogo en formato de documento portátil y, por lo tanto, no están disponibles en campos estructurados que se pueden buscar, filtrar y vincular a datos clínicos. La integración de datos clínicos y genómicos es un objetivo necesario para ayudar a la comparación electrónica de pacientes con ensayos de base molecular y para agregar múltiples experimentos N-de-1 en pacientes individuales para desarrollar evidencia de beneficio en el mundo real. Las interfaces personalizadas se pueden desarrollar a través de relaciones con laboratorios genómicos de terceros y empresas de tecnología de la información o de forma independiente en instituciones más grandes que poseen profundos recursos de bioinformática y tecnología de la información. Varios laboratorios ahora ofrecen recursos, como el portal Caris Life Sciences Molecular Intelligence 21 y el portal Foundation Medicine Interactive Cancer Explorer, 22 que permiten búsquedas de resultados con alguna capacidad de base de datos y proporcionan documentación de la investigación clínica y preclínica disponible relacionada con las variantes observadas. y terapias. La interpretación clínica de las alteraciones moleculares es fundamental para aportar el valor de la oncología de precisión.

Recientemente, el cáncer de pulmón, después de varias décadas de elegir dobletes a base de platino para cada paciente, ha experimentado una transformación integrando la medicina de precisión. En la actualidad, se necesitan numerosos biomarcadores para la evaluación del tratamiento en pacientes con cáncer de pulmón (Tabla 3), y este número seguirá aumentando a medida que se identifiquen nuevos subconjuntos definidos molecularmente. Al diagnosticar a un paciente, medir EGFR mutación, y ALK o ROS1 fusiones, ayudarán a determinar si se debe usar un inhibidor de la tirosina quinasa (TKI) en lugar de la quimioterapia citotóxica. 23 Recientemente, la expresión de PD-L1 (puntuación de proporción de tumores ≥ 50%) ha demostrado ser eficaz para enriquecer a los pacientes con cáncer de pulmón que pueden beneficiarse de la inmunoterapia (pembrolizumab) en lugar de la quimioterapia. 24 Al considerar a los pacientes que son diagnosticados con cáncer de pulmón de células no pequeñas, estos biomarcadores pueden alterar las decisiones de tratamiento en aproximadamente el 50% de los pacientes con agentes biológicos en lugar de quimioterapia citotóxica.

El uso cada vez mayor de terapias dirigidas también pone de relieve el creciente desafío clínico de la farmacorresistencia adquirida, que actualmente es un área de investigación muy activa. Esto se ejemplifica mejor con la aparición de la mutación EGFR T790M, que ocurre en el 50% de los pacientes tratados previamente con un EGFR-TKI. 25 Estas mutaciones guardianas, que interfieren directamente con las interacciones fármaco-objetivo, son un tema recurrente en muchos tumores impulsados ​​por quinasas tratados con inhibidores de quinasas. 26 Lo que impulsa su importancia es el desarrollo concomitante de (1) terapias diseñadas para atacar estas mutaciones y superar la resistencia (p. Ej., T790M / osimertinib), y (2) ensayos no invasivos que pueden monitorear el estado de las mutaciones de resistencia (p. Ej., Prueba de mutación cobas EGFR v2), secuencialmente y en tiempo real.

La complejidad asociada con la resistencia adquirida se ve agravada por la heterogeneidad intra e intertumor 27 y la biología adaptativa del tumor que se ve facilitada por la inestabilidad genética. 25 La presión selectiva de la inhibición de la quinasa puede conducir a la desaparición de mutaciones de resistencia a fármacos, 28 aparición de diversos mecanismos de resistencia en diferentes sitios metastásicos, 29 transformación histológica a cáncer de pulmón microcítico, 30 o aparición de nuevos clones resistentes (p. Ej., C797S, Leu792 ). 31 Cada una de estas situaciones presenta enfoques de tratamiento únicos. Por ejemplo, existen informes de respuestas a tratamientos específicos del cáncer de pulmón de células pequeñas para tumores que se han transformado en cáncer de pulmón de células pequeñas. También ha tenido éxito la reexposición con inhibidores de la tirosina quinasa EGFR de primera generación en pacientes en los que desaparece el clon T790M. 32

La utilización del panorama genético en evolución de los tumores para informar las decisiones de tratamiento será posible mediante el seguimiento secuencial y en tiempo real del paciente. La rebiopsia con técnicas tradicionales de biopsia en el momento de la progresión, que puede ocurrir en múltiples momentos durante el curso del tratamiento, no es segura para el paciente ni factible desde una perspectiva práctica. Además, los pacientes pueden tener múltiples tumores. Por lo tanto, el desafío también es identificar el tumor que produciría la biopsia de mejor calidad; sin embargo, ese enfoque aún no aborda el potencial de heterogeneidad entre tumores.

Se ha avanzado mucho para abordar estos problemas complejos y en evolución mediante el desarrollo de ensayos no invasivos basados ​​en plasma para la detección de mutaciones de resistencia emergentes. La Administración de Drogas y Alimentos de EE. UU. Aprobó el primer diagnóstico complementario basado en biopsia líquida para detectar la mutación de resistencia T790M en pacientes cuya enfermedad está progresando con erlotinib, gefitinib o afatinib, para considerar el osimertinib. Además, se está intensificando la búsqueda de ensayos que utilicen métodos de detección basados ​​en PCR o NGS, que tengan una alta sensibilidad y especificidad, sean rentables y tengan una alta concordancia con las biopsias tumorales. 33 -35 Algunos estudios señalan, sin embargo, que la biopsia líquida aún no está lista para el reemplazo de biopsias tumorales pero, en algunos casos, como el monitoreo de la respuesta o la progresión, se puede priorizar. 36,37 Por lo tanto, en los casos en los que una prueba de biopsia líquida es negativa para una mutación de resistencia, las guías recomiendan una biopsia de tejido. 23

En conjunto, estos esfuerzos de investigación están convergiendo para crear un nuevo paradigma en la medicina de precisión en oncología. El descubrimiento de mutaciones de resistencia, el diseño de nuevos fármacos que se dirijan a estos mecanismos de resistencia y el desarrollo de técnicas no invasivas para monitorear la aparición de resistencias son todos componentes integrales que hacen avanzar el campo. El siguiente caso destaca la revolución de la medicina de precisión que se está produciendo en el cáncer de pulmón.

El Sr. G, un hombre de 55 años, se ha sentido fatigado durante los últimos meses. Una tos persistente llevó a una cita con el médico. No tenía antecedentes de tabaquismo, aunque sus padres sí fumaban cigarrillos. Su estado funcional era bueno y no tenía ninguna otra afección médica crónica. Las imágenes radiográficas con TC identificaron varias lesiones en los pulmones de forma bilateral. Una biopsia guiada por TC reveló un adenocarcinoma bien diferenciado. El resto de las exploraciones de estadificación revelaron enfermedad en estadio IV en los pulmones bilaterales. Se realizaron pruebas moleculares que revelaron una deleción del exón 19. El paciente inició tratamiento con afatinib 40 mg al día. Tenía acné de grado 1 y diarrea de grado 1. La TC de seguimiento después de 2 meses de tratamiento reveló una respuesta significativa de los tumores. Continuó el tratamiento, y finalmente la dosis se redujo a 30 mg después de varios meses de tratamiento. El paciente continuó tomando afatinib durante 20 meses cuando una exploración de reestadificación reveló una nueva enfermedad de forma bilateral. La enfermedad se localizó periféricamente, con la lesión más grande de aproximadamente 1 cm. Realizar una biopsia de tejido sería un desafío pero factible. Una prueba de ADN tumoral circulante en suero reveló una mutación T790M. A continuación, el paciente inició tratamiento con osimertinib 80 mg al día. La reestadificación después de 2 meses reveló una contracción de los tumores. Está tolerando bien la terapia y continúa en este momento.

El objetivo de las pruebas de precisión es identificar la terapia óptima para el paciente que maximizará su supervivencia y calidad de vida. En algunos casos, existen biomarcadores bien validados en un contexto tumoral específico con evidencia clínica de alta calidad (a menudo aprobada por la Administración de Drogas y Alimentos de los EE. UU.) De una eficacia mejorada utilizando un agente dirigido específico o una clase de agentes frente a un terapia no selectiva. Por ejemplo, cada nuevo diagnóstico de cáncer de pulmón de células no pequeñas metastásico debe someterse a pruebas moleculares para EGFR mutación, ALK reordenamiento, ROS1 reordenamiento y PD-L1 expresión, todos los cuales han demostrado un beneficio mejorado con agentes dirigidos para tumores positivos para estos biomarcadores en comparación con la quimioterapia en el entorno de primera línea. En contraste, mutado RAS es una contraindicación para la adición de terapia anti-EGFR para el cáncer colorrectal metastásico debido a la falta de eficacia bien demostrada en este entorno. La prueba de estos biomarcadores en el contexto clínico apropiado es el estándar de atención y está cubierta por el seguro. Con beneficios probados, indicaciones claras y cobertura financiera, el principal desafío en este subconjunto es la subutilización de las pruebas y la difusión e implementación de la adopción oportuna para maximizar los beneficios para todos los pacientes. La Red Nacional Integral del Cáncer, la ASCO y otras sociedades específicas de tumores proporcionan pautas actualizadas periódicamente y son buenas referencias para las pruebas basadas en evidencia. En la Tabla 3 se enumeran ejemplos de estas combinaciones validadas de contexto, biomarcadores y fármacos.

TABLA 3. Ejemplos de pares de biomarcadores / fármacos aprobados por la Administración de Alimentos y Medicamentos de EE. UU. Para tumores específicos

Sin embargo, existe una lista mucho más larga de combinaciones de contexto, biomarcadores y fármacos sin pruebas suficientes para establecer un estándar de atención (Tabla 4). El costo de NGS ha disminuido en órdenes de magnitud en los últimos años. Los centros oncológicos y otros centros médicos académicos a menudo tienen sus propios paneles de genes del cáncer "de cosecha propia", y varias empresas ofrecen secuenciación de paneles de genes por varios miles de dólares en unas pocas semanas. Dado el costo razonable, el tiempo de respuesta rápido y el potencial para el descubrimiento de nuevos biomarcadores a los que se puede dirigir el objetivo, el uso de pruebas de panel ha proliferado en los centros médicos académicos y en la comunidad. Los biomarcadores estándar se prueban en estos paneles de genes, pero además, también se presentan de forma rutinaria alteraciones en genes sin evidencia suficiente de una terapia eficaz correspondiente.

TABLA 4. Ejemplos de pruebas de precisión sin utilidad clínica establecida

La interpretación y comunicación de estos datos a los pacientes y su traducción en intervenciones terapéuticas es un desafío abrumador para los médicos. Por ejemplo, BRAF Los melanomas con mutación V600E responden excepcionalmente bien a BRAF y MEK inhibidores, pero la respuesta en los cánceres colorrectales a estos fármacos como monoterapias ha sido decepcionante. 38,39 Bases de datos cuidadosamente seleccionadas de alteraciones genómicas como OncoKB 40 y MyCancerGenome 41 han desarrollado marcos para ayudar a priorizar terapias para alteraciones genómicas (Fig. 1). Sin embargo, el uso de estos biomarcadores para seleccionar la terapia es todavía en gran parte experimental y debe realizarse en el marco de un estudio clínico en un centro experimentado, donde el apoyo estructurado está disponible para el paciente y los datos se pueden recopilar y agregar de manera apropiada para responder a la investigación clínica y preguntas. Se debe enfatizar que en la comunicación con los pacientes, los médicos deben dejar en claro que más allá del conjunto limitado de pruebas validadas con las terapias validadas correspondientes, la selección de la terapia basada en los perfiles genómicos tumorales es experimental y sin un beneficio claramente establecido.

FIGURA 1. Ejemplo de jerarquía de evidencia de alteraciones genómicas

Siempre que sea posible, se debe animar a los pacientes a participar en estudios clínicos. La estratificación molecular de los tumores de los pacientes aumenta el desafío de acumular suficientes pacientes para potenciar la detección del beneficio (o la falta del mismo) en estos subconjuntos de tumores. Se han desarrollado una variedad de diseños de ensayos clínicos para validar los biomarcadores predictivos, incluida la asignación aleatoria de pacientes estratificados por biomarcadores (IPASS, 42 MARVEL 43), estudios de enriquecimiento con asignación a brazos de estudio por estado de biomarcadores (BATTLE, 44 I-SPY 2 45) y diseños de prueba adaptativos. 46 NCI-MATCH (NCT02465060) es un ensayo clínico patrocinado por el Instituto Nacional del Cáncer diseñado para manejar el problema de la baja acumulación mediante la combinación de múltiples tipos de tumores como un ensayo de canasta basado en la alteración molecular en lugar del tipo de tumor, así como para maximizar el número de sitios participantes para optimizar la inscripción. 47 ASCO ha iniciado el Estudio de registro de utilización de perfiles y agentes dirigidos (TAPUR), que recopilará datos del mundo real sobre el uso de agentes aprobados para tratar variantes moleculares dirigidas a través de tipos de enfermedades. 48 ensayos de paraguas, como el ensayo Lung MAP patrocinado por el Instituto Nacional del Cáncer (NCT02154490), reclutan pacientes de un tipo de tumor determinado (carcinoma de células escamosas metastásico recurrente) y los colocan en grupos basados ​​en biomarcadores (p. Ej., PI3KCA mutación) con terapias dirigidas (por ejemplo, taselisib). 49

La gran mayoría de los pacientes no participan en estudios clínicos basados ​​en biomarcadores, y sus datos genómicos y clínicos serían de gran ayuda para la investigación si pudieran recopilarse, agregarse y estructurarse adecuadamente. Esto ha impulsado iniciativas para compartir y agrupar datos entre múltiples instituciones, como el proyecto GENIE 50 patrocinado por la Asociación Estadounidense para la Investigación del Cáncer y ORIEN. 51 Además, las colaboraciones directas de pacientes, como el Proyecto de cáncer de mama metastásico, 52 en el que pacientes individuales dan permiso directamente para que los datos clínicos y el tejido tumoral se recopilen de diferentes centros médicos y se analicen de forma centralizada, podrían proporcionar datos importantes en enfermedades de baja frecuencia. La ASCO está desarrollando aún más el programa CancerLinQ 53 para crear una plataforma de datos en la que se puedan recopilar y analizar datos clínicos (y genómicos, cuando estén disponibles) de un grupo mucho más grande de pacientes tratados en una gama más amplia de entornos, tanto para obtener beneficios clínicos como de investigación. La Iniciativa Cancer Moonshot 54 identificó la agregación de datos y un ecosistema de datos común como componentes clave para acelerar el ritmo de la investigación del cáncer.

Más allá del conjunto actual de pruebas existentes, se están desarrollando nuevas tecnologías prometedoras. El ADN tumoral libre de células que se encuentra en el plasma sanguíneo se ha detectado en múltiples entornos de tumores metastásicos 19 una biopsia líquida evita la morbilidad de las biopsias tradicionales y permite un seguimiento más frecuente, lo que permite una detección más temprana de la respuesta o el desarrollo de resistencia. Además, se ha demostrado heterogeneidad genómica tumoral entre lesiones primarias y metastásicas y 55 lesiones metastásicas diferentes 56,57 e incluso en diferentes regiones 58 de la misma lesión. Por tanto, una biopsia líquida puede presentar un perfil integrado del tumor. Además, las técnicas novedosas que utilizan enfoques bioinformáticos para inferir deficiencias en las vías de reparación del ADN a partir de datos genómicos 59 pueden predecir la respuesta a las terapias que dañan el ADN. La secuenciación de ARN de una sola célula, 60 o la desconvolución de la secuenciación de ARN en masa 61 para identificar subconjuntos de células inmunes específicas en el microambiente tumoral, 62 pueden ayudar a predecir qué tumores probablemente responderán a la terapia inmunológica. Es probable que en el futuro múltiples enfoques ómicos, incluidas las alteraciones del ADN genómico, las modificaciones epigenéticas, la expresión del ARNm basada en el transcriptoma, la expresión proteómica y las alteraciones en moléculas reguladoras como el microARN y los factores inmunitarios, proporcionen un retrato más integrado del tumor y el microambiente. .

En un mundo de reembolso basado en el valor, donde la calidad se define por el resultado / costo, es esencial para las prácticas de oncología mantener listas actualizadas de pares dirigidos por biomarcadores / objetivos para los cuales existe evidencia convincente de que las pruebas de biomarcadores identifican un factor importante. oportunidad terapéutica (p. ej., crizotinib para ALKcáncer de pulmón reordenado) o permite evitar una terapia tóxica (por ejemplo, cetuximab en KRAS cáncer colorrectal mutante). Las métricas de calidad se centrarán cada vez más en evitar la infrautilización de estas pruebas establecidas, ya que la evidencia clínica ya ha establecido la terapia seleccionada con biomarcadores como una estrategia superior.

Por el contrario, el uso de pruebas de panel amplio es más complejo. Los pagadores pueden tener autorizaciones previas integradas para limitar el uso de pruebas de panel en determinadas circunstancias clínicas. Las pruebas de panel pueden ser valiosas si se utilizan para identificar un lote de pares validados de biomarcador / objetivo, así como para respaldar la investigación. Sin embargo, también debe evitarse el uso excesivo de pruebas de panel. Es fundamental que cuando se obtengan estas pruebas, los oncólogos tengan acceso al apoyo necesario para la interpretación. Por último, se prevé que la vinculación de estos informes genómicos con historias de tratamiento detalladas y resultados clínicos como la respuesta, la duración de la respuesta y la supervivencia acelerará el descubrimiento de estrategias terapéuticas eficaces.

La oncología de precisión tiene utilidad clínica aquí y ahora, pero la promesa para el futuro es mucho mayor. Con las rápidas mejoras en la tecnología, está claramente a la vista una mayor capacidad para sondear más allá de las alteraciones simples del ADN a otros componentes moleculares que influyen en el comportamiento del tumor y representan objetivos para nuevas terapias. El uso responsable de esta extraordinaria tecnología dependerá de la generación de evidencia a través de nuevos diseños de ensayos clínicos, la agregación de datos moleculares y clínicos en bases de datos del mundo real y un análisis cuidadoso para determinar las asociaciones relevantes entre el objetivo y el agente. En última instancia, el enfoque debe demostrar su valor en poblaciones específicas de pacientes. El oncólogo en ejercicio debe esforzarse por comprender el poder y las limitaciones del panorama actual de pruebas y tratamientos para ayudar a los pacientes a tomar las decisiones mejor informadas.

Lo siguiente representa la información de divulgación proporcionada por los autores de este manuscrito. Todas las relaciones se consideran compensadas. Las relaciones son autosuficientes a menos que se indique lo contrario. I = Miembro de la familia inmediata, Inst = Mi institución. Es posible que las relaciones no se relacionen con el tema de este manuscrito. Para obtener más información sobre la política de conflictos de intereses de la ASCO, consulte www.asco.org/rwc.

Honorarios: Amgen, NanoString, Technologies, Novartis, Pfizer

Rol de consultoría o asesoría: Bristol-Myers Squibb, Caris Life Sciences, Genomic Health, Helsinn Therapeutics, Pfizer, Spectrum, Productos farmacéuticos, Tesaro

Honorarios: AstraZeneca, Boehringer Ingelheim, Celgene, Lilly, Merck, Pfizer

Rol de consultoría o asesoría: AstraZeneca, Boehringer Ingelheim, Celgene, Lilly, Merck, Pfizer

Fondos de investigación: Boehringer Ingelheim, Genentech / Roche, Ignyta, Lilly, Merck

Viajes, alojamiento, gastos: AstraZeneca, Boehringer Ingelheim, Celgene, Lilly

Sin relación que revelar

Rol de consultoría o asesoría: Revista de la Asociación Médica Estadounidense

Fondos de investigación: Pfizer

Otra relación: JAMA-Revista de la Asociación Médica Estadounidense


Limitaciones anteriores y métodos novedosos para vincular la heterogeneidad intratumoral y la resistencia a los fármacos

La heterogeneidad intratumoral no solo permite la supervivencia de las células residuales de la enfermedad que eventualmente es la causa de una recaída tumoral más agresiva, sino que también sirve como impulso para el fracaso de los inhibidores dirigidos como agente único para inducir una respuesta duradera y beneficios de supervivencia a pesar del notable tumor inicial. respuesta. También se ha demostrado que los agentes de dirección de próxima generación, aunque pueden inhibir las formas mutantes resistentes a los fármacos de la diana pretendida, provocan una respuesta terapéutica incompleta. El ejemplo más destacado de la insuficiencia de los inhibidores dirigidos de próxima generación para frenar la eventual progresión de la enfermedad es el caso del inhibidor de EGFR de tercera generación, osimertinib en EGFR Tumores mutados T790M [39]. Como se describió anteriormente, la mutación T790M en EGFR hace que las células sean resistentes a los inhibidores de primera generación. Si bien la respuesta a osimertinib en pacientes con compatibilidad genómica suele ser notable, la resistencia adquirida se desarrolla incluso antes (mediana general de SLP & # x02009 = & # x020098.2 & # x000a0 meses) [105] que en los tumores tratados con erlotinib con EGFR activación de mutaciones (mediana global de SLP & # x02009 = & # x020099,7 & # x000a0 meses) [106]. También se observa una disminución similar en el tiempo de progresión para ALKCPCNP reordenado (mediana general de SLP con crizotinib & # x02009 = & # x020098.0 & # x0201310.0 & # x000a0 meses [107 & # x02013109], mediana general de SLP de ceritinib & # x02009 = & # x020097.0 & # x000a0 meses [110]). Sin embargo, estas observaciones pueden atribuirse al hecho de que los pacientes de estos estudios fueron tratados previamente con al menos una línea de terapia, y que el tumor en general ha sido más heterogéneo en el momento del tratamiento para superar la farmacorresistencia adquirida ya establecida. Tratamiento de primera línea con osimertinib en NSCLC avanzado con mutante EGFR arrojó una SLP media general de unos impresionantes 19,3 & # x000a0 meses en el estudio de fase I [40]. Más recientemente, se confirmaron observaciones similares en el ensayo clínico de fase III, que reveló que el tratamiento de primera línea con osimertinib condujo a una tasa de respuesta similar en comparación con los EGFR-TKI de primera generación (80% frente a 76%), pero resultó en una tasa de respuesta significativa PFS superior (18,9 & # x000a0 meses frente a 10,2 & # x000a0 meses) [42]. Es tentador postular que el uso preventivo de osimertinib como TKI de primera línea en EGFR-los pacientes con NSCLC mutante dieron como resultado no solo la prevención de EGFR Emergencia de la mutación T790M pero también una & # x0201c respuesta molecular más profunda & # x0201d en las células tumorales adictas al oncogén. Podría decirse que esta evidencia clínica presta más apoyo al concepto de una inhibición dirigida & # x0201c preventiva & # x0201d que es más superior a un enfoque terapéutico dirigido & # x0201creactivo & # x0201d secuencial. Con lo que se conoce actualmente con respecto a la ERM, este notable retraso en el desarrollo de la resistencia a los medicamentos podría mejorarse aún más si se dirigen a los impulsores de enfermedades residuales simultáneamente en forma de terapia combinada de orientación múltiple racional.

La terapia de polidirección inicial racional tiene el potencial de inducir una respuesta tumoral más completa y duradera que la monoterapia debido a la capacidad de la primera para abordar no solo los problemas de heterogeneidad tumoral, sino también la naturaleza multifacética de la ERM. Para superar la resistencia a la terapia dirigida de genotipo coincidente, se puede probar como tratamiento de primera línea o secuencialmente a la primera línea de tratamiento de primera línea o secuencialmente a la primera línea de tratamiento de la terapia de polialegación racional para atacar el principal impulsor de oncoproteínas adictivas, así como la (s) molécula (s) de señalización en la vía de escape del fármaco / que confiere resistencia. fracaso del tratamiento de línea. Es comprensible que, en muchos casos, la terapia de polialectura de segunda línea haya demostrado una baja eficacia debido al establecimiento previo de resistencia a los medicamentos, que podría ser ya de naturaleza heterogénea, después del fracaso de la terapia de primera línea [111 & # x02013114]. Por otro lado, el uso de la terapia de polirrotección racional como estrategia terapéutica de primera línea antes de la persistencia / aparición de la resistencia molecular del fármaco posiblemente pueda servir como una barrera de contención eficaz contra la resistencia al fármaco asociada con la monoterapia dirigida. Esto también se ejemplifica en el caso de combinar inhibidores de BRAF con inhibidores de MEK1 para superar la señalización de derivación de la cascada de señalización RAF-MEK-ERK en BRAF Melanoma mutante V600E [115, 116]. Esta estrategia ahora ha sido adoptada y aprobada para su uso en BRAF-Cáncer de pulmón mutante recientemente [117 & # x02013119]. La terapia de combinación de inhibidores de BRAF-MEK de primera línea mejoró la supervivencia del paciente en comparación con la monoterapia con inhibidores de BRAF de primera línea, de acuerdo con la hipótesis de que dirigirse a las células tumorales residuales puede prevenir la progresión del tumor final [120 & # x02013122]. Estos estudios demuestran la importancia del momento oportuno en la administración de la terapia de polidirección para controlar eficazmente la enfermedad residual y la resistencia a los fármacos. A pesar de ofrecer mejores respuestas prometedoras, las terapias racionales de orientación múltiple aún podrían ser limitadas y desafiantes debido al mayor riesgo de eventos adversos en comparación con la monoterapia [120 & # x02013122]. No obstante, esto podría al menos en parte mitigarse mediante el diseño optimizado de fármacos y el desarrollo de fármacos que tengan una ventana terapéutica mejorada con una eficacia diana más potente y específica y menos efectos adversos fuera del objetivo. Un ejemplo reciente de terapia combinada exitosa se ve en el estudio IMpower 150, en el que se administraron atezolizumab, bevacizumab, carboplatino y paclitaxel (ABCP) en combinación en pacientes con CPNM no escamoso metastásico [123]. Tanto la supervivencia general como la supervivencia libre de progresión mejoraron significativamente en comparación con el estándar de atención con riesgos de seguridad similares. Este estudio también demostró ser eficaz como terapia de primera línea independientemente de la expresión de PD-L1 y EGFR o ALK estado de alteración genética. En particular, se encontró que era eficaz como estrategia de tratamiento para los pacientes resistentes a la terapia dirigida con EGFR mutación o ALK-reordenamiento. Se cree que la quimioinmunoterapia combinada con la terapia de antiangiogénesis influye en la TME al mejorar la eficacia de la inmunoterapia PD-L1 como mecanismo de acción subyacente. Además, también se ha informado recientemente que la terapia de combinación ABCP podría inducir una respuesta completa notable incluso después de tan solo un ciclo de tratamiento en pacientes muy pretratados. EGFR-Adenocarcinoma de pulmón mutante que progresó a través de erlotinib y osimertinib en la farmacorresistencia dirigida [124]. Se justifican los esfuerzos para combinar agentes que no solo se dirijan a los mecanismos de resistencia que no se superponen, sino que también provoquen menos eventos adversos, y deben guiarse por la comprensión del estado de enfermedad residual en la selección de agentes y la medición de la eficacia en las terapias de polialegación [125].

Como se ilustró anteriormente, la comprensión de la ERM es inseparable de la comprensión de la heterogeneidad intratumoral. Las técnicas desarrolladas recientemente permiten estudios más profundos de la heterogeneidad espacial y temporal dentro de un solo tumor. Al abordar la heterogeneidad espacial, se han empleado métodos de secuenciación del genoma completo y del exoma completo en varias regiones [73, 126] para superar el problema del muestreo limitado de un tumor en el análisis genómico del cáncer. El estudio TRACERx llevó a cabo la secuenciación del exoma completo de biopsias multirregionales de un solo tumor (al menos con una separación de 0,3 & # x000a0cm a 1,0 & # x000a0cm) en pacientes con CPCNP resecados en estadio I a III, y demostró las diferencias mutacionales y de número de copias entre las regiones de un tumor único [73]. Se encontró que la inestabilidad cromosómica contribuyó a la adquisición de mutaciones impulsoras subclonales heterogéneas y alteraciones en el número de copias más adelante en el desarrollo del tumor. Mutaciones del controlador en EGFR, REUNIÓ, BRAF, y TP53 se encontraron casi siempre clonales en los adenocarcinomas de pulmón, mientras que las alteraciones en PIK3CA, NF1, genes implicados en la modificación de la cromatina y la respuesta y reparación del daño del ADN ocurrieron más tarde en la evolución del tumor. Estos estudios sugieren que la detección de mutaciones específicas en biopsias individuales puede no reflejar el perfil del tumor en su conjunto. El estudio de la evolución del tumor a lo largo del curso del tratamiento utilizando los métodos descritos anteriormente tiene el potencial de dilucidar los biomarcadores asociados con la respuesta al tratamiento y la resistencia adquirida.

Una desventaja de la secuenciación multirregional es la necesidad de tomar muestras de biopsias múltiples, lo cual no es práctico e indeseable en el escenario de atención al paciente de la vida real, particularmente en enfermedades en estadio avanzado [127]. Con este fin, las biopsias líquidas junto con el perfil molecular han ganado mucho impulso en los últimos años. La biopsia líquida puede ser bastante beneficiosa ya que es menos invasiva en comparación con las biopsias de tejido tradicionales y puede proporcionar un perfil tumoral más completo, presumiblemente con una mejor representación de la heterogeneidad tumoral [128 & # x02013130]. Generalmente, la biopsia líquida implica aislar células tumorales circulantes (CTC) o ADN tumoral circulante (ADNct) de muestras de sangre y, posteriormente, realizar ensayos moleculares, genómicos y proteómicos para obtener un perfil holístico del tumor. Actualmente, la biopsia líquida clínicamente adaptada normalmente implica ensayos de ctDNA basados ​​en plasma que utilizan secuenciación de próxima generación en la mutación genómica o la determinación del número de copias. En 2016, la FDA de EE. UU. Aprobó el Cobas EGFR Prueba de mutación v2 como diagnóstico complementario in vitro para la detección de deleciones del exón 19, mutaciones por sustitución del exón 21 L858R y mutaciones T790M de muestras de plasma [131, 132]. La aprobación se basó en el estudio ENSURE, un estudio multicéntrico, abierto, aleatorizado de fase III para evaluar la eficacia y seguridad de erlotinib frente a gemcitabina más cisplatino como tratamiento de primera línea para pacientes con CPCNP en estadio IIIB / IV [133]. El plasma dio positivo en EGFR mutaciones en el 76,7% de las muestras de tejido positivo y dio negativo en el 98,2% de las muestras de tejido negativo. La aprobación de la prueba de Cobas dio lugar a múltiples investigaciones, incluidas las que estudiaron el ADNct en plasma para la predicción temprana de la respuesta a los inhibidores de la tirosina quinasa [134], para la detección de EGFR-T790M en pacientes con CPCNP previamente tratados con EGFR-TKI con progresión de la enfermedad [135], y para el desarrollo de AZD9291 (osimertinib) [105, 136]. Un estudio investigó la elegibilidad de pacientes con CPCNP previamente tratados para osimertinib mediante la prueba de la presencia de la mutación T790M en su plasma [135]. Aunque las pruebas de plasma solo concuerdan moderadamente con las pruebas de tejido (61% positivas, 79% negativas), la comparación de las pruebas de plasma con la secuenciación de próxima generación arrojó tasas de concordancia positiva y negativa del 90% o más. Además, los ensayos de carga tumoral [137] y de carga mutacional tumoral [138, 139] se están desarrollando en este campo como una indicación de la respuesta al tratamiento y como un biomarcador predictivo potencial para la inmunoterapia, respectivamente. Tan poderosa como promete ser la biopsia líquida, está limitada por la heterogeneidad intertumoral. Más específicamente, la incapacidad de rastrear la fuente de los ctDNA, lo que da como resultado la posibilidad de confundir los análisis posteriores debido a la heterogeneidad intertumoral. García-Sáenz y col. descubrió que aunque el plasma PIK3CA niveles de mutación correlacionados con la respuesta al tratamiento en la mayoría de los pacientes con cáncer de mama avanzado en su cohorte, la tasa de discordancia de la respuesta al tratamiento fue tan alta como el 25% (2/8 pacientes), y la discordancia se atribuyó a la sensibilidad diferencial del fármaco dentro del tumor metastásico [137] . Como se mencionó anteriormente, la biopsia de un solo punto de tiempo, ya sea como muestras de tejido o plasma, proporciona información limitada sobre la historia evolutiva y el futuro del tumor. Para superar este problema, se pueden realizar biopsias longitudinales seriadas para analizar los cambios en el tumor con o sin presión terapéutica. Debido a la relativa facilidad para los pacientes, la biopsia líquida está ganando mucho impulso como método más preferible para el seguimiento longitudinal de la evolución del tumor.

El análisis molecular unicelular es cada vez más importante para descubrir la clonalidad y reconstruir el linaje evolutivo de un tumor. Los análisis masivos agregan resultados de múltiples células de una muestra y corren el riesgo de perder información vital de subpoblaciones de células raras [140]. Utilizando técnicas unicelulares, Lawson et al. demostraron que la subpoblación de células metastásicas de cáncer de mama son únicas en su mayor expresión de genes asociados a la EMT, de tipo madre, de supervivencia y de latencia [141]. Al igual que las células con potencial metastásico, las células MRD son subpoblaciones raras dentro de los tumores sensibles a fármacos que a menudo impulsan la progresión de la enfermedad. Rambow y col. demostraron la viabilidad de utilizar una combinación de técnicas de captura basadas en fluorescencia y microfluídica para estudiar y apuntar al impulsor de la ERM en el melanoma expuesto a la inhibición concurrente de RAF / MEK [142]. Los autores identificaron un programa transcripcional asociado con células madre de la cresta neural en las células de melanoma residuales mínimas impulsadas por el receptor nuclear RXRG y demostraron que la señalización de RXR dirigida tiene sinergia con la terapia dirigida para retrasar el tiempo hasta la progresión de la enfermedad. Los métodos de proteómica unicelulares desarrollados recientemente permiten la detección de proteínas multiplexadas a partir de células individuales y el análisis de la expresión funcional de proteínas simultáneamente con la expresión génica [143, 144]. Sin embargo, los análisis de células individuales carecen de su capacidad para recapitular los efectos de las interacciones célula-célula y célula-matriz, ya que el tumor debe disociarse antes de realizar estos experimentos. No obstante, la mayor resolución de los métodos unicelulares y la capacidad de multiplexación prometen una identificación temprana de los impulsores de la resistencia y ayudan en el desarrollo de terapias racionales de orientación múltiple que pueden prevenir de manera preventiva la progresión del tumor impulsada por células de enfermedad residuales.


Terminología

La heterogeneidad es una propiedad de una población celular, no de células individuales. La heterogeneidad de una población implica la presencia de variabilidad de célula a célula con respecto a un rasgo medible (o más de uno) X, dónde X puede ser el nivel celular de una molécula determinada, como una proteína, o cualquier parámetro funcional o morfológico cuantificable. Un análisis más detallado del término "heterogeneidad" revela muchas facetas y formas que rara vez se articulan explícitamente. Por lo tanto, un intento de crear una taxonomía y definir términos y nombrar fenómenos recién descritos representa un problema lingüístico que llega al campo de la onomasiología (ver Glosario, Recuadro 1). Proponemos el siguiente esquema (mostrado en la Figura 2) que organiza operativamente la heterogeneidad en una jerarquía de dicotomías (ver Glosario, Cuadro 1).

Heterogeneidad genética versus no genética

La heterogeneidad de las poblaciones celulares no es trivial si se considera la heterogeneidad dentro de una población clonal, es decir, genéticamente idéntica de células, ya que con demasiada frecuencia en biología, cualquier variación en el fenotipo se explica por una variación genética. Este "determinismo genético", que ha dominado el pensamiento biológico durante décadas (Strohman, 1997), deja poco espacio para variaciones no genéticas (Jablonka, 1994 Lewontin, 2000 Morange, 2001 Strohman, 1994). La variabilidad genética como fuente de heterogeneidad en las células es un concepto sencillo, pero no obstante relevante, en la biología del cáncer; por ejemplo, la heterogeneidad entre las células tumorales se explica comúnmente por mutaciones genéticas. Esta heterogeneidad genética (ver Glosario, Cuadro 1), a su vez, se cree que es promovida por la inestabilidad genómica en las células cancerosas (Lengauer et al., 1998 Loeb, 2001 Tomlinson et al., 2002). En otras palabras, la heterogeneidad con respecto al rasgo X es genético en que la diferencia en X entre células individuales se debe a la presencia de genes distintos que controlan el rasgo X en estas celdas.

Por el contrario, la heterogeneidad no genética (ver Glosario, Recuadro 1) en poblaciones de células clonales desafía el determinismo genético y plantea una pregunta simple, cuya respuesta podríamos dar por sentada: ¿cómo puede el mismo conjunto de genes generar vastamente distintos, estables y a menudo heredó perfiles de expresión génica y, por lo tanto, fenotipos distintos? Esta pregunta está en el centro de la multipotencia, como se analiza a continuación.

Para evitar ambigüedades en la discusión adicional, dos términos clave necesitan mayor aclaración. Primero, el término general "no genético" debe distinguirse del término más específico "epigenético", que es

Cuadro 1. Glosario

Estado de atracción. Un estado de red estacionario y estacionario en el que un conjunto de estados de red particulares eventualmente evolucionará ("se sentirá atraído"). Esto sucede porque las interacciones entre los elementos de la red imponen restricciones de modo que la mayoría de los estados de la red teóricamente posibles es inestable y se moverá hacia un estado atractor.

Clon, o un grupo clonal de células. Un grupo de células que contiene solo células que comparten un ancestro común y, por lo tanto, se supone que son genéticamente idénticas. Sin embargo, de acuerdo con esta definición, los organismos completos, derivados de un cigoto, serían clones. Por lo tanto, en el contexto de la variabilidad fenotípica, "clonal", que a menudo se equipara con "genéticamente idéntico", debe definirse de manera más estricta (ver texto).

Dicotomía. La partición de una entidad completa X (un conjunto, concepto o fenómeno) en dos, y solo dos, subconjuntos A y B, que son mutuamente excluyentes y juntos cubren todos los elementos posibles pertenecientes a X.

Ergodicidad. Propiedad de un sistema o proceso que satisface la hipótesis ergódica en física estadística, según la cual el promedio a lo largo del tiempo de una cantidad (fluctuante) del sistema es el mismo que el promedio en un momento dado sobre una gran muestra de réplicas de ese sistema (= conjunto).

Heterogeneidad extrínseca. Variabilidad de célula a célula (típicamente a nivel de micro-heterogeneidad) en una población causada por factores ambientales no uniformes que afectan diferencialmente a células individuales.

Heterogeneidad genética. Propiedad de una población (por ejemplo, de células) en la que los genomas de los miembros individuales (células) no son idénticos para todos los miembros y que, por tanto, contiene una mezcla de genomas distintos. Considerado con frecuencia en biología tumoral, donde las diferencias en la secuencia del genoma entre las células tumorales podrían explicar las diferencias de rasgos debidas a mutaciones somáticas.

Heterogeneidad intrínseca. Variabilidad de célula a célula (típicamente a nivel de micro-heterogeneidad) en ausencia de inhomogeneidades en el microambiente. Más comúnmente explicado por el "ruido de expresión génica" (ruido temporal), pero también se aplica al ruido de la población (ver Fig. 3).

Macroheterogeneidad. Heterogeneidad de una población celular debido a la presencia de una variedad de tipos de células discretamente distintos o de células en estados obviamente distintos, tales como células progenitoras frente a células diferenciadas. La macroheterogeneidad se manifiesta como una distribución multimodal de un rasgo. X en un histograma de la población (véanse las figuras 2 y 4).

Microheterogeneidad. Heterogeneidad dentro de una población celular aparentemente uniforme que se cree que consiste en células idénticas. La microheterogeneidad se manifiesta como la varianza (extensión) de una única distribución en forma de campana (véanse las figuras 2 y 4).

Estado de la red en un momento determinado. El estado de un sistema (red) de elementos que interactúan (genes) que se define conjuntamente por todos los valores de actividades de los elementos (por ejemplo, niveles de expresión génica) en un momento dado. El estado de la red de una red reguladora de genes se refleja así en el perfil de expresión génica.

Heterogeneidad no genética (o fenotípica). Propiedad de una población (por ejemplo, de células) que se refiere a la variabilidad fenotípica entre sus miembros, que comparten el mismo genoma. Por lo tanto, las diferencias de rasgos no se deben a diferencias genéticas entre las células.

Onomasiología. Rama de la semántica que se ocupa de la cuestión de qué término utilizar para describir un concepto o fenómeno (novedoso), en contraste con la semasiología, que se ocupa de cómo definir un término que ya está en uso. Si la onomasiología se trata de nombrar, la semasiología se trata de significado (Baldinger, 1980).

Ontología. Un dominio de la filosofía que se ocupa de cuestiones fundamentales sobre la naturaleza del ser, como la relación entre la existencia misma ("ser") de las entidades y su esencia ("ser tal"). En el contexto de la biología de las células madre, las preguntas ontológicas incluyen: ¿existen las células madre como entidades independientes y, de ser así, cuáles son sus propiedades definitorias (esenciales)? ¿Es la "madre" una identidad o simplemente un estado de una célula, o incluso una propiedad de un grupo de células? En informática, la ontología se refiere a la especificación de una conceptualización compartida, como en "ontología genética".

Ruido de la población. La variabilidad entre individuos en una población nominalmente uniforme debido a distintos rasgos estacionarios que difieren entre los miembros individuales (ver Fig. 3C).

Paisaje cuasi-potencial. Una construcción conceptual, inspirada en la mecánica clásica y la idea de energía potencial, para ayudar a visualizar las fuerzas que cambian el estado de un sistema dentro del "espacio de estados" (es decir, el espacio abstracto de todos los estados del sistema teóricamente posibles). Utiliza la intuición de que alguna forma de "gravedad" tira de ese sistema hacia los puntos más bajos del paisaje (ver Cuadro 2).

Ruido temporal. El cambio de una cantidad mensurable a lo largo del tiempo en un patrón desordenado debido a fluctuaciones aleatorias (Fig. 3A).

Mediciones de los niveles de proteína basadas en el promedio de la población versus las células individuales. (A) Ejemplos de información enmascarada cuando se utilizan métodos de promediado de la población, como la transferencia Western, para medir cambios en los niveles de proteínas. Las células progenitoras hematopoyéticas se trataron con eritropoyetina (EPO) para inducir la diferenciación de eritroides y se controlaron los niveles de c-Kit a lo largo del tiempo. (a) La inmunotransferencia muestra una disminución en los niveles generales de c-Kit. (B) La citometría de flujo revela la progresión temporal de la distribución poblacional de la expresión de la superficie de c-Kit. (C) Un diagrama de bifurcación podría explicar la separación de la población en subpoblaciones c-Kit-low y c-Kit-high (líneas continuas), aunque los niveles generales disminuyan (línea punteada). (B) El análisis de citometría de flujo a nivel de células individuales distingue entre (a) un aumento continuo de proteínas en cada célula y (B) el cambio no sincrónico casi todo o nada (ON-OFF) de la expresión de proteínas. Ambos dan lugar al aumento aparentemente gradual de la intensidad de la banda en el western blot mostrado. El aumento gradual de la intensidad de la banda en b surge del encendido estadístico no sincrónico de la expresión, lo que refleja la fracción de células de la población que se encuentran en el estado ON, contenidas en el lisado utilizado para la transferencia de Western. En realidad, incluso una respuesta formal de todo o nada tiene un tiempo de cambio finito, pero el cambio en los niveles de expresión sigue siendo muy pronunciado, y los verdaderos niveles intermedios que no se deben a la mezcla de celdas de conmutación asincrónica se verían solo en el único -nivel de celda en el monitoreo de intervalo denso, la observación a nivel de población se ve oscurecida por la asincronía.

Mediciones de los niveles de proteína basadas en el promedio de la población versus las células individuales. (A) Ejemplos de información enmascarada cuando se utilizan métodos de promediado de la población, como la transferencia Western, para medir cambios en los niveles de proteínas. Las células progenitoras hematopoyéticas se trataron con eritropoyetina (EPO) para inducir la diferenciación de eritroides y se controlaron los niveles de c-Kit a lo largo del tiempo. (a) Western blot muestra una disminución en los niveles generales de c-Kit. (B) La citometría de flujo revela la progresión temporal de la distribución poblacional de la expresión de la superficie de c-Kit. (C) Un diagrama de bifurcación podría explicar la separación de la población en subpoblaciones c-Kit-low y c-Kit-high (líneas continuas), aunque los niveles generales disminuyan (línea punteada). (B) El análisis de citometría de flujo a nivel de células individuales distingue entre (a) un aumento continuo de proteínas en cada célula y (B) el cambio no sincrónico casi todo o nada (ON-OFF) de la expresión de proteínas. Ambos dan lugar al aumento aparentemente gradual de la intensidad de la banda en el western blot mostrado. El aumento gradual de la intensidad de la banda en b surge del encendido estadístico no sincrónico de la expresión, lo que refleja la fracción de células de la población que se encuentran en el estado ON, tal como está contenida en el lisado utilizado para la transferencia de Western. En realidad, incluso una respuesta formal de todo o nada tiene un tiempo de cambio finito, pero el cambio en los niveles de expresión sigue siendo muy pronunciado, y los verdaderos niveles intermedios que no se deben a la mezcla de celdas de conmutación asincrónica se verían solo en el único -nivel de celda en el monitoreo de intervalo denso, la observación a nivel de población se ve oscurecida por la asincronía.

En el primer uso, que se encuentra cada vez más en la biología de sistemas, se emplea 'epigenético' (como en 'paisaje epigenético'), como lo acuñó originalmente Conrad Waddington (Waddington, 1957), para referirse a una multiplicidad de estados de expresión génica estables en sistemas que exhiben "multiestabilidad", como se explica a continuación (véase el recuadro 1).

Por el contrario, los biólogos moleculares usan "epigenético" (como en "marca epigenética") para referirse a la metilación del ADN y las modificaciones de histonas (Goldberg et al., 2007 Kouzarides, 2007), que sirven como una explicación próxima para estados de expresión génica relativamente estables. Una "marca epigenética" es la prima conceptual de una "mutación genética", las cuales se utilizan para explicar cambios fenotípicos duraderos mediante la invocación de un evento molecular. Sin embargo, las marcas epigenéticas en el genoma en realidad no explican la existencia de estados heredados estables, como los tipos de células, que originalmente inspiraron el término "epigenético", porque las modificaciones covalentes son en realidad dinámicas, reversibles y carecen de especificidad de locus. Por lo tanto, no son, estrictamente hablando, explicativos, sino que representan un mecanismo molecular para implementar patrones de expresión génica estables que primero deben ser orquestados por la red transcripcional. Es esta red de regulación genética la que crea el "paisaje epigenético" en el sentido de Waddington, como se explica a continuación (Bonifer et al., 2008 Huang, 2009 Ptashne, 2007 Slack, 2002).

En segundo lugar, para un discurso sobre la heterogeneidad no genética en poblaciones clonales (isogénicas) (ver Glosario, Cuadro 1), se requiere una definición estricta de lo que es un "clon". El término "clonal" no sólo significa "genéticamente idéntico" si fuera así, todo organismo multicelular desarrollado derivado de un cigoto sería, en un sentido trivial, un clon. Sin embargo, nadie llamaría "clonales" a una mezcla de células de la médula ósea (isogénicas) que incluyen células madre, precursores de glóbulos blancos y rojos, etc. Por lo tanto, una definición más estricta y no trivial de clonalidad es que las células de una población clonal (ver Glosario, Cuadro 1) son (1) derivadas recientemente de una sola célula ancestral ('colonia'), (2) dentro del mismo uniforme y microambiente constante, y (3) han logrado, como población, una cierta estacionariedad.

Macroheterogeneidad versus microheterogeneidad

En la visión trivial de un organismo completo como un clon, se podrían considerar las diferencias fenotípicas entre los tipos de células nominales (por ejemplo, célula hepática versus neurona) como una especie de heterogeneidad no genética. Como la definición de lo que constituye un tipo de célula versus un subtipo o una variante fenotípica no es del todo clara, proponemos el término macroheterogeneidad (ver Glosario, Cuadro 1) para describir la variabilidad evidente entre (sub) poblaciones discretas, que pueden representar ya sea tipos de células, subtipos o simplemente 'variantes' con respecto a un rasgo X. Por el contrario, nos referimos a la heterogeneidad entre células dentro de un tipo de célula nominalmente idéntico en una población aparentemente uniforme como micro-heterogeneidad (ver Glosario, Cuadro 1). Fundamentalmente, a pesar de la imprecisión que rodea a la definición de un "tipo de célula", se puede hacer una delimitación clara en función de la distribución estadística de un rasgo. X observado en una población, como en la citometría de flujo. Aquí, la macro-heterogeneidad se manifiesta como la presencia de múltiples "picos" discretos, pero posiblemente superpuestos (es decir, una distribución multimodal). Por el contrario, la microheterogeneidad se refleja en la extensión (amplitud) de un pico (ver Figura 2, recuadro). La multimodalidad indica multiestabilidad, es decir, la presencia de múltiples estados atractores distintos, como se analiza a continuación.

Heterogeneidad extrínseca versus intrínseca

La variación del fenotipo entre las células de una sola población clonal puede ser causada por factores extrínsecos que no actúan de manera uniforme sobre la población y, por lo tanto, desencadenan una respuesta celular en solo una fracción de la población. Esto se conoce como heterogeneidad extrínseca (ver Glosario, Cuadro 1) y surge, por ejemplo, cuando una población clonal crece en un entorno complejo, como nichos de tejido, donde las células difieren en su vecindad de los vasos sanguíneos, otras células o estructuras, o cuando las células en cultivo difieren con respecto a su distancia de las células vecinas y al borde de la placa, o con respecto a los gradientes de oxígeno, etc. La heterogeneidad de la población celular simplemente reflejaría la heterogeneidad del entorno. Tal heterogeneidad debida a la instrucción diferencial desde el exterior juega un papel clave en el desarrollo. En particular, las primeras diversificaciones de linajes celulares en el embrión temprano, como el linaje dividido en trofectodermo y masa celular interna, parecen beneficiarse de las asimetrías físicas del embrión (células internas versus externas, polaridad) (Zernicka-Goetz et al., 2009). De manera similar, la información posicional, como la proporcionada por los gradientes de morfógenos, impulsa aún más la heterogeneidad (extrínseca) en las últimas ondas de diversificación del destino celular (Oates et al., 2009).

Heterogeneidad de la población celular. Una representación esquemática de terminologías y conceptos utilizados en el estudio de la heterogeneidad de la población celular, organizada en una jerarquía de dicotomías: heterogeneidad genética versus no genética heterogeneidad extrínseca versus intrínseca no genética macro versus micro-heterogeneidad dentro de la heterogeneidad intrínseca no genética y la población versus ruido temporal dentro de la microheterogeneidad (para más detalles, consulte el texto y el Recuadro 1, Glosario). El recuadro representa un histograma de citometría de flujo que revela una distribución bimodal, que refleja dos subpoblaciones distintas.

Heterogeneidad de la población celular. Una representación esquemática de terminologías y conceptos utilizados en el estudio de la heterogeneidad de la población celular, organizada en una jerarquía de dicotomías: heterogeneidad genética versus no genética heterogeneidad extrínseca versus intrínseca no genética macro versus micro-heterogeneidad dentro de la heterogeneidad intrínseca no genética y la población versus ruido temporal dentro de la microheterogeneidad (para más detalles, consulte el texto y el Recuadro 1, Glosario). El recuadro representa un histograma de citometría de flujo que revela una distribución bimodal, que refleja dos subpoblaciones distintas.

La heterogeneidad intrínseca (véase el glosario, recuadro 1), por el contrario, no puede explicarse de forma obvia y directa por una causa externa. En cambio, denota la diversificación espontánea de una población clonal en variantes continuas o discretamente distintas. La diversificación intrínseca tiene un significado profundo en las ciencias de sistemas complejos, ya que es esencial para la generación espontánea de patrones complejos: el paradigma de una propiedad emergente que es característica de un sistema vivo (Goodwin, 1993 Kauffman, 1993). La diversificación intrínseca de un estado simétrico inicialmente insesgado requiere dos procesos: primero, un evento de ruptura de simetría (como se ejemplifica en la bifurcación en la figura 1A) que crea opciones alternativas discretas y segundo, un proceso estocástico (como el ruido de expresión génica, como se explica a continuación) que impulsa la elección de estas opciones. En la teoría de la complejidad, dicha diversificación intrínseca se ha relacionado con inestabilidades e irreversibilidad en sistemas que no están en equilibrio (Nicolis y Prigogine, 1989 Prigogine, 1997).


Sobre el Autor

Cosimo Commisso es profesor asistente en el programa de redes de señalización y metabolismo del cáncer en el centro oncológico designado por el NCI Sanford Burnham Prebys en La Jolla, California. En 2013, mientras era becario postdoctoral en el laboratorio de Dafna Bar-Sagi en la NYU, el Dr. Commisso dirigió un equipo que descubrió cómo la macropinocitosis apoya el crecimiento tumoral al servir como una ruta de suministro de aminoácidos en los cánceres impulsados ​​por RAS. Su laboratorio se centra en comprender la base molecular de la macropinocitosis inducida por RAS y el impacto de la heterogeneidad metabólica en la tumorigénesis y las terapias dirigidas contra el cáncer.

Referencias seleccionadas

Guo, J. Y. et al. Genes Devel 25 460 (2011)

Commisso, C. et al. Naturaleza 497, 633 (2013)

Daemen, A. y col. Proc Natl Acad Sci U S A 112 E4410 (2015)


Fondo

Un tumor es una población heterogénea de células que contiene células cancerosas transformadas, células de apoyo y células que se infiltran en el tumor. Esta heterogeneidad intratumoral se ve reforzada por la variación clonal y las influencias microambientales en las células cancerosas, que tampoco representan un conjunto homogéneo de células. Las primeras observaciones mostraron que los tumores contienen subclones que difieren con respecto al cariotipo y la sensibilidad a la quimioterapia [1, 2]. Esfuerzos de elaboración de perfiles más recientes, utilizando la secuenciación en profundidad y el perfil de metilación de varias regiones tumorales, revelaron múltiples clones con mutaciones genéticas distintas e hipermetilación del promotor dentro de un solo tumor [3, 4]. Es importante destacar que la naturaleza de esta heterogeneidad no se limita a la población de células cancerosas malignas, ya que un tumor es un ecosistema complejo que contiene células tumorales y otros tipos de células, como células endoteliales, células inmunes infiltrantes, células estromales y una red compleja de matriz extracelular (MEC), que define las diferencias espacio-temporales en el microambiente tumoral [5, 6]. Posiblemente, tanto la heterogeneidad del tumor como del microambiente determinan la idoneidad del tumor y, como tal, es probable que sean factores cruciales en el éxito del tratamiento.

Se han propuesto dos modelos para explicar la heterogeneidad dentro de un tumor. En el modelo de evolución clonal, las mutaciones estocásticas en células tumorales individuales sirven como plataforma para la adaptación y selección de los clones más aptos de un tumor. Como tal, este modelo explica la heterogeneidad intratumoral como resultado de la selección natural. Los clones que adquieren la ventaja de crecimiento se expandirán mientras que los clones con menos aptitud serán eliminados y eventualmente se extinguirán. Es importante destacar que estas ventajas clonales pueden diferir en el tiempo y el espacio, ya que pueden estar presentes diferentes requisitos en diferentes áreas del tumor. Ciertas áreas pueden seleccionar clones "aptos para hipoxia", mientras que otras regiones más densas en nutrientes pueden seleccionar clones de crecimiento rápido. Durante el curso de la enfermedad, estos clones pueden cambiar espacial y temporalmente dando como resultado una arquitectura subclonal compleja, que se ve reforzada por la aplicación de la terapia [7-9]. El segundo modelo que se propone para instalar la heterogeneidad intratumoral es el modelo de células madre cancerosas (CSC). Este modelo sugiere que solo un subconjunto de células cancerosas posee una capacidad de autorrenovación indefinida para iniciar y mantener el crecimiento tumoral. Por lo tanto, los tumores se organizan de manera jerárquica, equivalente a la jerarquía de tejido normal respaldada por células madre sanas. En consecuencia, las CSC generan heterogeneidad celular al instalar una jerarquía de diferenciación que conduce a una variedad de tipos de células distintos presentes dentro del tumor [10]. Sin embargo, debe tenerse en cuenta que esta jerarquía no es una ruta unidireccional, sino que puede ser reversible o plástica, por lo que las células diferenciadas terminalmente también pueden desdiferenciarse y obtener propiedades de CSC en condiciones específicas [11, 12]. El concepto de plasticidad celular ha reconciliado en parte los modelos estocásticos y CSC. Por ejemplo, la mutación en una célula diferenciada puede dotar de capacidad de autorrenovación y establecer un nuevo clon de CSC jerárquico, agregando la diversidad funcional dentro de un tumor [13, 14].

A continuación, proporcionamos una descripción general de cómo se instalan las características de tallo en las células (cancerosas) y, por lo tanto, influyen en la plasticidad de esta población. Primero nos enfocamos en los factores intrínsecos, como los factores genéticos y epigenéticos, que consideramos son las propiedades inherentes que contribuyen a las capacidades de autorrenovación. En segundo lugar, analizaremos los factores extrínsecos, como el microambiente y la terapia tumorales, que pueden influir en los fenotipos celulares. Explorar el mecanismo de la autorrenovación y la competencia de plasticidad puede permitir a los investigadores interferir con estos procesos y, en última instancia, mejorar el manejo del cáncer.


Referencias

Taylor BS, Ladanyi M: Genómica clínica del cáncer: ¿qué tan pronto es ahora ?. J Pathol. 2011, 223: 318-326.

Sosman JA, Kim KB, Schuchter L, Gonzalez R, Pavlick AC, Weber JS, McArthur GA, Hutson TE, Moschos SJ, Flaherty KT, Hersey P, Kefford R, Lawrence D, Puzanov I, Lewis KD, Amaravadi RK, Chmielowski B , Lawrence HJ, Shyr Y, Ye F, Li J, Nolop KB, Lee RJ, Joe AK, Ribas A: Survival in BRAF V600-mutante avanzado melanoma tratado con vemurafenib. N Engl J Med. 2012, 366: 707-714. 10.1056 / NEJMoa1112302.

Metzker ML: tecnologías de secuenciación: la próxima generación. Nat Rev Genet. 2010, 11: 31-46. 10.1038 / nrg2626.

Wold B, Myers RM: Métodos de censo de secuencia para genómica funcional. Métodos Nat. 2008, 5: 19-21. 10.1038 / nmeth1157.

Cancer Genome Atlas Research Network: Retratos moleculares completos de tumores de mama humanos. Naturaleza. 2012, 490: 61-70. 10.1038 / nature11412.

Banerji S, Cibulskis K, Rangel-Escareno C, Brown KK, Carter SL, Frederick AM, Lawrence MS, Sivachenko AY, Sougnez C, Zou L, Cortes ML, Fernandez-Lopez JC, Peng S, Ardlie KG, Auclair D, Bautista -Pina V, Duke F, Francis J, Jung J, Maffuz-Aziz A, Onofrio RC, Parkin M, Pho NH, Quintanar-Jurado V, Ramos AH, Rebollar-Vega R, Rodriguez-Cuevas S, Romero-Cordoba SL, Schumacher SE, Stransky N, Thompson KM, Uribe-Figueroa L, Baselga J, Beroukhim R, Polyak K, Sgroi DC, Richardson AL, Jimenez-Sanchez G, Lander ES, Gabriel SB, Garraway LA, Golub TR, Melendez-Zajgla J , Toker A, Getz G, Hidalgo-Miranda A, Meyerson M: Análisis de secuencia de mutaciones y translocaciones entre subtipos de cáncer de mama. Naturaleza. 2012, 486: 405-409. 10.1038 / nature11154.

Ellis MJ: El análisis del genoma completo informa la respuesta del cáncer de mama a la inhibición de la aromatasa. Naturaleza. 2012, 486: 353-360.

Stephens PJ: paisajes complejos de reordenamiento somático en genomas de cáncer de mama humano. Naturaleza. 2009, 462: 1005-1010. 10.1038 / nature08645.

Stephens PJ: El panorama de los genes del cáncer y los procesos mutacionales en el cáncer de mama. Naturaleza. 2012, 486: 400-404.

Nik-Zainal S: La historia de vida de 21 cánceres de mama. Celda. 2012, 149: 994-1007. 10.1016 / j.cell.2012.04.023.

Shah SP: El espectro de evolución clonal y mutacional de los cánceres de mama primarios triple negativos. Naturaleza. 2012, 486: 395-399.

Nik-Zainal S: Procesos mutacionales que moldean los genomas de 21 cánceres de mama. Celda. 2012, 149: 979-993. 10.1016 / j.cell.2012.04.024.

Cancer Genome Atlas Research Network: análisis genómicos integrados del carcinoma de ovario. Naturaleza. 2011, 474: 609-615. 10.1038 / nature10166.

Cancer Genome Atlas Research Network: Caracterización molecular integral del cáncer de colon y recto humano. Naturaleza. 2012, 487: 330-337. 10.1038 / nature11252.

Seshagiri S, Stawiski EW, Durinck S, Modrusan Z, Storm EE, Conboy CB, Chaudhuri S, Guan Y, Janakiraman V, Jaiswal BS, Guillory J, Ha C, Dijkgraaf GJ, Stinson J, Gnad F, Huntley MA, Degenhardt JD , Haverty PM, Bourgon R, Wang W, Koeppen H, Gentleman R, Starr TK, Zhang Z, Largaespada DA, Wu TD, de Sauvage FJ: fusiones recurrentes de R-spondin en el cáncer de colon. Naturaleza. 2012, 488: 660-664. 10.1038 / nature11282.

Hammerman PS, Hayes DN, Wilkerson MD, Schultz N, Bose R, Chu A, Collisson EA, Cope L, Creighton CJ, Getz G, Herman JG, Johnson BE, Kucherlapati R, Ladanyi M, Maher CA, Robertson G, Sander C , Shen R, Sinha R, Sivachenko A, Thomas RK, Travis WD, Tsao MS, Weinstein JN, Wigle DA, Baylin SB, Govindan R, Meyerson M: Caracterización genómica completa de los cánceres de pulmón de células escamosas. Naturaleza. 2012, 489: 519-525. 10.1038 / nature11404.

Totoki Y, Tatsuno K, Yamamoto S, Arai Y, Hosoda F, Ishikawa S, Tsutsumi S, Sonoda K, Totsuka H, ​​Shirakihara T, Sakamoto H, Wang L, Ojima H, Shimada K, Kosuge T, Okusaka T, Kato K , Kusuda J, Yoshida T, Aburatani H, Shibata T: Caracterización de alta resolución de un genoma de carcinoma hepatocelular. Nat Genet. 2011, 43: 464-469. 10.1038 / ng.804.

Gerlinger M, Rowan AJ, Horswell S, Larkin J, Endesfelder D, Gronroos E, Martinez P, Matthews N, Stewart A, Tarpey P, Varela I, Phillimore B, Begum S, McDonald NQ, Butler A, Jones D, Raine K , Latimer C, Santos CR, Nohadani M, Eklund AC, Spencer-Dene B, Clark G, Pickering L, Stamp G, Gore M, Szallasi Z, Downward J, Futreal PA, Swanton C: heterogeneidad intratumoral y evolución ramificada revelada por multirregión secuenciación. N Engl J Med. 2012, 366: 883-892. 10.1056 / NEJMoa1113205.

Agrawal N, Frederick MJ, Pickering CR, Bettegowda C, Chang K, Li RJ, Fakhry C, Xie TX, Zhang J, Wang J, Zhang N, El-Naggar AK, Jasser SA, Weinstein JN, Trevino L, Drummond JA, Muzny DM, Wu Y, Wood LD, Hruban RH, Westra WH, Koch WM, Califano JA, Gibbs RA, Sidransky D, Vogelstein B, Velculescu VE, Papadopoulos N, Wheeler DA, Kinzler KW, Myers JN: secuenciación Exome de cabeza y El carcinoma de células escamosas de cuello revela mutaciones inactivadoras en NOTCH1. Ciencias. 2011, 333: 1154-1157. 10.1126 / science.1206923.

Berger MF: la secuenciación del genoma del melanoma revela mutaciones frecuentes de PREX2. Naturaleza. 2012, 485: 502-506.

Ding L: evolución clonal en la leucemia mieloide aguda recidivante revelada por la secuenciación del genoma completo. Naturaleza. 2012, 481: 506-510. 10.1038 / nature10738.

Welch JS: El origen y evolución de mutaciones en la leucemia mieloide aguda. Celda. 2012, 150: 264-278. 10.1016 / j.cell.2012.06.023.

Wong KM, Hudson TJ, McPherson JD: Desentrañar la genética del cáncer: secuenciación del genoma y más. Annu Rev Genomics Hum Genet. 2011, 12: 407-430. 10.1146 / annurev-genom-082509-141532.

Cahill DP, Kinzler KW, Vogelstein B, Lengauer C: inestabilidad genética y selección darwiniana en tumores. Trends Cell Biol. 1999, 9: M57-M60. 10.1016 / S0962-8924 (99) 01661-X.

Brosnan JA, Iacobuzio-Donahue CA: Una nueva rama en el árbol: secuenciación de próxima generación en el estudio de la evolución del cáncer. Semin Cell Dev Biol. 2012, 23: 237-242. 10.1016 / j.semcdb.2011.12.008.

Swanton C: heterogeneidad intratumoral: evolución a través del espacio y el tiempo. Cancer Res. 2012, 72: 4875-4882. 10.1158 / 0008-5472.CAN-12-2217.

Russnes HG, Navin N, Hicks J, Borresen-Dale AL: Información sobre la heterogeneidad del cáncer de mama a través de la secuenciación de próxima generación. J Clin Invest. 2011, 121: 3810-3818. 10.1172 / JCI57088.

Samuel N, Hudson TJ: traduciendo la genómica a la clínica. 2012, Química clínica: implicaciones de la heterogeneidad del cáncer

Almendro V, Fuster G: Heterogeneidad del cáncer de mama: etiología y relevancia clínica. Oncología clínica y traslacional: publicación oficial de la Federación de Sociedades Españolas de Oncología y del Instituto Nacional del Cáncer de México. 2011, 13: 767-773. 10.1007 / s12094-011-0731-9.

Yancovitz M, Litterman A, Yoon J, Ng E, Shapiro RL, Berman RS, Pavlick AC, Darvishian F, Christos P, Mazumdar M, Osman I, Polsky D: heterogeneidad intra e inter tumoral de mutaciones BRAF (V600E)) en melanoma primario y metastásico. Más uno. 2012, 7: e29336-10.1371 / journal.pone.0029336.

Curtis C, Shah SP, Chin SF, Turashvili G, Rueda OM, Dunning MJ, Speed ​​D, Lynch AG, Samarajiwa S, Yuan Y, Graf S, Ha G, Haffari G, Bashashati A, Russell R, McKinney S, Langerod A , Green A, Provenzano E, Wishart G, Pinder S, Watson P, Markowetz F, Murphy L, Ellis I, Purushotham A, Borresen-Dale AL, Brenton JD, Tavare S, Caldas C, Aparicio S: La arquitectura genómica y transcriptómica de 2.000 tumores de mama revela nuevos subgrupos. Naturaleza. 2012, 486: 346-352.

Desai AN, Jere A: Secuenciación de próxima generación: ¿lista para las clínicas ?. Clin Genet. 2012, 81: 503-510. 10.1111 / j.1399-0004.2012.01865.x.

Welch JS, Westervelt P, Ding L, Larson DE, Klco JM, Kulkarni S, Wallis J, Chen K, Payton JE, Fulton RS, Veizer J, Schmidt H, Vickery TL, Heath S, Watson MA, Tomasson MH, Link DC , Graubert TA, DiPersio JF, Mardis ER, Ley TJ, Wilson RK: Uso de secuenciación del genoma completo para diagnosticar un oncogén de fusión críptico. JAMA. 2011, 305: 1577-1584. 10.1001 / jama.2011.497.

Li H, Ruan J, Durbin R: Mapeo de lecturas de secuenciación de ADN cortas y variantes de llamada utilizando puntuaciones de calidad de mapeo. Genome Res. 2008, 18: 1851-1858. 10.1101 / gr.078212.108.

Li H, Durbin R: alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática. 2009, 25: 1754-1760. 10.1093 / bioinformática / btp324.

Li H, Durbin R: Alineación de lectura larga rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática. 2010, 26: 589-595. 10.1093 / bioinformatics / btp698.

Langmead B, Salzberg SL: alineación rápida de lectura con espacios vacíos con Bowtie 2. Métodos Nat. 2012, 9: 357-359. 10.1038 / nmeth.1923.

Homer N, Merriman B, Nelson SF: BFAST: una herramienta de alineación para la resecuenciación del genoma a gran escala. Más uno. 2009, 4: e7767-10.1371 / journal.pone.0007767.

Li R, Yu C, Li Y, Lam TW, Yiu SM, Kristiansen K, Wang J: SOAP2: una herramienta ultrarrápida mejorada para alineación de lectura corta. Bioinformática. 2009, 25: 1966-1967. 10.1093 / bioinformatics / btp336.

Ning Z, Cox AJ, Mullikin JC: SSAHA: un método de búsqueda rápida para grandes bases de datos de ADN. Genome Res. 2001, 11: 1725-1729. 10.1101 / gr.194201.

Rumble SM, Lacroute P, Dalca AV, Fiume M, Sidow A, Brudno M: SHRiMP: mapeo preciso de lecturas breves de espacio de color. PLoS Comput Biol. 2009, 5: e1000386-10.1371 / journal.pcbi.1000386.

DePristo MA, Banks E, Poplin R, Garimella KV, Maguire JR, Hartl C, Philippakis AA, del Angel G, Rivas MA, Hanna M, McKenna A, Fennell TJ, Kernytsky AM, Sivachenko AY, Cibulskis K, Gabriel SB, Altshuler D, Daly MJ: un marco para el descubrimiento de variaciones y el genotipado utilizando datos de secuenciación de ADN de próxima generación. Nat Genet. 2011, 43: 491-498. 10.1038 / ng.806.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R: The Sequence Alignment / Map format y SAMtools. Bioinformática. 2009, 25: 2078-2079. 10.1093 / bioinformatics / btp352.

Li R, Li Y, Fang X, Yang H, Wang J, Kristiansen K: detección de SNP para resecuenciación masiva del genoma completo en paralelo. Genome Res. 2009, 19: 1124-1132. 10.1101 / gr.088013.108.

Goya R, Sun MG, Morin RD, Leung G, Ha G, Wiegand KC, Senz J, Crisan A, Marra MA, Hirst M, Huntsman D, Murphy KP, Aparicio S, Shah SP: SNVMix: predicción de variantes de un solo nucleótido a partir de la siguiente -secuenciación de generaciones de tumores. Bioinformática. 2010, 26: 730-736. 10.1093 / bioinformática / btq040.

Koboldt DC, Chen K, Wylie T, Larson DE, McLellan MD, Mardis ER, Weinstock GM, Wilson RK, Ding L: VarScan: detección de variantes en secuenciación masivamente paralela de muestras individuales y agrupadas. Bioinformática. 2009, 25: 2283-2285. 10.1093 / bioinformática / btp373.

Lam HY, Pan C, Clark MJ, Lacroute P, Chen R, Haraksingh R, O’Huallachain M, Gerstein MB, Kidd JM, Bustamante CD, Snyder M: Detección y anotación de variaciones genéticas mediante la canalización HugeSeq. Nat Biotechnol. 2012, 30: 226-229. 10.1038 / nbt.2134.

Liu Q, Guo Y, Li J, Long J, Zhang B, Shyr Y: Pasos para garantizar la precisión en las llamadas de genotipos y SNP desde los datos de secuenciación de Illumina. BMC Genomics. 2012, 13: T8-

Wang W, Wei Z, Lam TW, Wang J: La secuenciación de próxima generación tiene una cobertura de secuencia más baja y una capacidad de detección de SNP más pobre en las regiones reguladoras. Sci Rep.2011, 1: 55-

Koboldt DC, Zhang Q, Larson DE, Shen D, McLellan MD, Lin L, Miller CA, Mardis ER, Ding L, Wilson RK: VarScan 2: descubrimiento de la mutación somática y la alteración del número de copias en el cáncer mediante secuenciación del exoma. Genome Res. 2012, 22: 568-576. 10.1101 / gr.129684.111.

Larson DE, Harris CC, Chen K, Koboldt DC, Abbott TE, Dooling DJ, Ley TJ, Mardis ER, Wilson RK, Ding L: SomaticSniper: identificación de mutaciones puntuales somáticas en datos de secuenciación del genoma completo. Bioinformática. 2012, 28: 311-317. 10.1093 / bioinformatics / btr665.

Roth A, Ding J, Morin R, Crisan A, Ha G, Giuliany R, Bashashati A, Hirst M, Turashvili G, Oloumi A, Marra MA, Aparicio S, Shah SP: JointSNVMix: un modelo probabilístico para la detección precisa de mutaciones somáticas en datos de secuenciación de próxima generación emparejados normales / tumorales. Bioinformática. 2012, 28: 907-913. 10.1093 / bioinformatics / bts053.

Kumar P, Henikoff S, Ng PC: Predicción de los efectos de codificar variantes no sinónimas en la función de la proteína utilizando el algoritmo SIFT. Nat Protocol. 2009, 4: 1073-1081. 10.1038 / nprot.2009.86.

Adzhubei IA, Schmidt S, Peshkin L, Ramensky VE, Gerasimova A, Bork P, Kondrashov AS, Sunyaev SR: un método y un servidor para predecir mutaciones sin sentido dañinas. Métodos Nat. 2010, 7: 248-249. 10.1038 / nmeth0410-248.

Wong WC, Kim D, Carter H, Diekhans M, Ryan MC, Karchin R: CHASM y SNVBox: conjunto de herramientas para detectar mutaciones de un solo nucleótido biológicamente importantes en el cáncer. Bioinformática. 2011, 27: 2147-2148. 10.1093 / bioinformatics / btr357.

Wang K, Li M, Hakonarson H: ANNOVAR: anotación funcional de variantes genéticas a partir de datos de secuenciación de alto rendimiento. Ácidos nucleicos Res. 2010, 38: e164-10.1093 / nar / gkq603.

Chen K, Wallis JW, McLellan MD, Larson DE, Kalicki JM, Pohl CS, McGrath SD, Wendl MC, Zhang Q, Locke DP, Shi X, Fulton RS, Ley TJ, Wilson RK, Ding L, Mardis ER: BreakDancer: un algoritmo para el mapeo de alta resolución de la variación estructural genómica. Métodos Nat. 2009, 6: 677-681. 10.1038 / nmeth.1363.

Hormozdiari F, Hajirasouliha I, Dao P, Hach F, Yorukoglu D, Alkan C, Eichler EE, Sahinalp SC: VariationHunter de próxima generación: algoritmos combinatorios para el descubrimiento de la inserción de transposones. Bioinformática. 2010, 26: i350-i357. 10.1093 / bioinformática / btq216.

Korbel JO, Abyzov A, Mu XJ, Carriero N, Cayting P, Zhang Z, Snyder M, Gerstein MB: PEMer: un marco computacional con modelos de error basados ​​en simulación para inferir variantes estructurales genómicas a partir de datos de secuenciación masiva de extremos emparejados. Genome Biol. 2009, 10: R23-10.1186 / gb-2009-10-2-r23.

Zeitouni B, Boeva ​​V, Janoueix-Lerosey I, Loeillet S, Legoix-ne P, Nicolas A, Delattre O, Barillot E: SVDetect: una herramienta para identificar variaciones estructurales genómicas a partir de datos de secuenciación de pares de pares y pares de pares. Bioinformática. 2010, 26: 1895-1896. 10.1093 / bioinformatics / btq293.

Trapnell C, Pachter L, Salzberg SL: TopHat: descubriendo uniones de empalme con RNA-Seq. Bioinformática. 2009, 25: 1105-1111. 10.1093 / bioinformática / btp120.

Wang K, Singh D, Zeng Z, Coleman SJ, Huang Y, Savich GL, He X, Mieczkowski P, Grimm SA, Perou CM, MacLeod JN, Chiang DY, Prins JF, Liu J: MapSplice: mapeo preciso de RNA-seq lee para el descubrimiento de uniones de empalme. Ácidos nucleicos Res. 2010, 38: e178-10.1093 / nar / gkq622.

Au KF, Jiang H, Lin L, Xing Y, Wong WH: Detección de uniones de empalme a partir de datos de secuencia de ARN de extremos emparejados mediante SpliceMap. Ácidos nucleicos Res. 2010, 38: 4570-4578. 10.1093 / nar / gkq211.

Wu TD, Nacu S: detección rápida y tolerante a SNP de variantes complejas y empalme en lecturas cortas. Bioinformática. 2010, 26: 873-881. 10.1093 / bioinformática / btq057.

Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, ​​Chaisson M, Gingeras TR: STAR: alineador de secuencia de ARN universal ultrarrápido. Bioinformática. 2013, 29: 15-21. 10.1093 / bioinformática / bts635.

Anders S, Huber W: análisis de expresión diferencial para datos de recuento de secuencias. Genome Biol. 2010, 11: R106-10.1186 / gb-2010-11-10-r106.

Robinson MD, McCarthy DJ, Smyth GK: edgeR: un paquete de bioconductores para el análisis de expresión diferencial de datos de expresión génica digital. Bioinformática. 2010, 26: 139-140. 10.1093 / bioinformática / btp616.

Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L: análisis diferencial de la regulación génica en la resolución de la transcripción con RNA-seq. Nat Biotechnol. 2012, 31: 46-53. 10.1038 / nbt.2450.

Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, Pimentel H, Salzberg SL, Rinn JL, Pachter L: análisis diferencial de expresión de genes y transcripciones de experimentos de RNA-seq con TopHat y Gemelos. Nat Protocol. 2012, 7: 562-578.

Griffith M, Griffith OL, Mwenifumbo J, Goya R, Morrissy AS, Morin RD, Corbett R, Tang MJ, Hou YC, Pugh TJ, Robertson G, Chittaranjan S, Ally A, Asano JK, Chan SY, Li HI, McDonald H , Teague K, Zhao Y, Zeng T, Delaney A, Hirst M, Morin GB, Jones SJ, Tai IT, Marra MA: Análisis de expresión alternativo por secuenciación de ARN. Métodos Nat. 2010, 7: 843-847. 10.1038 / nmeth.1503.

Katz Y, Wang ET, Airoldi EM, Burge CB: Análisis y diseño de experimentos de secuenciación de ARN para identificar la regulación de isoformas. Métodos Nat. 2010, 7: 1009-1015. 10.1038 / nmeth.1528.

Kim D, Salzberg SL: TopHat-Fusion: un algoritmo para el descubrimiento de nuevas transcripciones de fusión. Genome Biol. 2011, 12: R72-10.1186 / gb-2011-12-8-r72.

Chen K, Wallis JW, Kandoth C, Kalicki-Veizer JM, Mungall KL, Mungall AJ, Jones SJ, Marra MA, Ley TJ, Mardis ER, Wilson RK, Weinstein JN, Ding L: BreakFusion: identificación de genes basada en ensamblaje dirigido fusiones en los datos de secuenciación de extremos emparejados del transcriptoma completo. Bioinformática. 2012, 28: 1923-1924. 10.1093 / bioinformatics / bts272.

Li Y, Chien J, Smith DI, Ma J: FusionHunter: identificación de las transcripciones de fusión en el cáncer mediante el uso de pares de extremos de ARN-seq. Bioinformática. 2011, 27: 1708-1710. 10.1093 / bioinformatics / btr265.

McPherson A, Hormozdiari F, Zayed A, Giuliany R, Ha G, Sun MG, Griffith M, Heravi Moussavi A, Senz J, Melnyk N, Pacheco M, Marra MA, Hirst M, Nielsen TO, Sahinalp SC, Huntsman D, Shah SP: deFuse: un algoritmo para el descubrimiento de la fusión de genes en datos de RNA-Seq de tumores. PLoS Comput Biol. 2011, 7: e1001138-10.1371 / journal.pcbi.1001138.

Piazza R, Pirola A, Spinelli R, Valletta S, Redaelli S, Magistroni V, Gambacorti-Passerini C: FusionAnalyser: una nueva herramienta gráfica impulsada por eventos para el descubrimiento de reordenamientos de fusión. Ácidos nucleicos Res. 2012, 40: e123-10.1093 / nar / gks394.

Vaske CJ, Benz SC, Sanborn JZ, Earl D, Szeto C, Zhu J, Haussler D, Stuart JM: Inferencia de actividades de vías específicas del paciente a partir de datos genómicos de cáncer multidimensionales utilizando PARADIGM. Bioinformática. 2010, 26: i237-i245. 10.1093 / bioinformatics / btq182.

Cerami E, Demir E, Schultz N, Taylor BS, Sander C: el análisis de red automatizado identifica las vías centrales en el glioblastoma. Más uno. 2010, 5: e8918-10.1371 / journal.pone.0008918.

Ciriello G, Cerami E, Sander C, Schultz N: El análisis de exclusividad mutua identifica módulos de redes oncogénicas. Genome Res. 2012, 22: 398-406. 10.1101 / gr.125567.111.

Akavia UD, Litvin O, Kim J, Sanchez-Garcia F, Kotliar D, Causton HC, Pochanard P, Mozes E, Garraway LA, Pe’er D: Un enfoque integrado para descubrir los impulsores del cáncer. Celda. 2010, 143: 1005-1017.10.1016 / j.cell.2010.11.013.

Langmead B, Hansen KD, Leek JT: análisis de expresión diferencial de secuenciación de ARN a escala de nube con Myrna. Genome Biol. 2010, 11: R83-10.1186 / gb-2010-11-8-r83.

Anders S, Reyes A, Huber W: Detectando el uso diferencial de exones a partir de datos de RNA-seq. Genome Res. 2012, 22: 2008-2017. 10.1101 / gr.133744.111.

Forbes SA, Bindal N, Bamford S, Cole C, Kok CY, Beare D, Jia M, Shepherd R, Leung K, Menzies A, Teague JW, Campbell PJ, Stratton MR, Futreal PA: COSMIC: extracción de genomas de cáncer completos en el Catálogo de mutaciones somáticas en cáncer. Ácidos nucleicos Res. 2011, 39: D945-D950. 10.1093 / nar / gkq929.

Cerami E, Gao J, Dogrusoz U, Gross BE, Sumer SO, Aksoy BA, Jacobsen A, Byrne CJ, Heuer ML, Larsson E, Antipin Y, Reva B, Goldberg AP, Sander C, Schultz N: El portal de genómica del cáncer cBio : una plataforma abierta para explorar datos genómicos multidimensionales del cáncer. Cancer Discov. 2012, 2: 401-404. 10.1158 / 2159-8290.CD-12-0095.

Gundem G, Perez-Llamas C, Jene-Sanz A, Kedzierska A, Islam A, Deu-Pons J, Furney SJ, Lopez-Bigas N: IntOGen: integración y minería de datos de datos oncogenómicos multidimensionales. Métodos Nat. 2010, 7: 92-93. 10.1038 / nmeth0210-92.

Baudis M, Cleary ML: Progenetix.net: un repositorio en línea de datos de aberraciones citogenéticas moleculares. Bioinformática. 2001, 17: 1228-1229. 10.1093 / bioinformatics / 17.12.1228.

Treangen TJ, Salzberg SL: ADN repetitivo y secuenciación de próxima generación: desafíos y soluciones computacionales. Nat Rev Genet. 2012, 13: 36-46.

Cooper GM, Shendure J: Agujas en pilas de agujas: encontrar variantes que causan enfermedades en una gran cantidad de datos genómicos. Nat Rev Genet. 2011, 12: 628-640. 10.1038 / nrg3046.

Nekrutenko A, Taylor J: interpretación de datos de secuenciación de próxima generación: mejora de la reproducibilidad y la accesibilidad. Nat Rev Genet. 2012, 13: 667-672.

Eisenstein M: Leyendo el plan del cáncer. Nat Biotechnol. 2012, 30: 581-584. 10.1038 / nbt.2292.

Katsios C, Papaloukas C, Tzaphlidou M, Roukos DH: Pruebas basadas en secuenciación de próxima generación para la diversidad del paisaje mutacional del cáncer: ¿implicaciones clínicas ?. Experto Rev Mol Diagn. 2012, 12: 667-670. 10.1586 / erm.12.68.


Ver el vídeo: Célula tumoral. Cáncer (Mayo 2022).