Том 12 научных докладов, Номер статьи: 18487 (2022) Цитировать эту статью
784 Доступа
3 Альтметрика
Подробности о метриках
Использование секвенирования экзома для открытия биомаркеров и точной медицины требует связи вариаций на уровне нуклеотидов с функциональными изменениями в кодируемых белках. Однако для функционального аннотирования тысяч миссенс-мутаций, связанных с раком, или вариантов неопределенного значения (VUS), очистка вариантов белков для биохимического и функционального анализа является непомерно дорогостоящей и неэффективной. Мы описываем параллельную функциональную аннотацию (PFA) большого количества VUS с использованием небольших культур и неочищенных экстрактов в 96-луночных планшетах. Используя членов семейства гистон-метилтрансфераз, мы демонстрируем высокопроизводительную структурную и функциональную аннотацию мутаций, связанных с раком. Объединив функциональную аннотацию паралогов, мы обнаружили два филогенетических параметра и параметра кластеризации, которые повышают точность функциональных прогнозов на основе последовательностей до более чем 90%. Наши результаты демонстрируют ценность PFA для определения онкогенных/опухолевых супрессорных функций гистоновых метилтрансфераз, а также повышения точности алгоритмов на основе последовательностей при прогнозировании эффектов мутаций, связанных с раком.
Функциональная аннотация мутаций, связанных с раком, является сложной задачей1,2. Большинство миссенс-мутаций происходят в положениях, функция которых неизвестна, что предотвращает идентификацию мутаций водителя и нейтрального (пассажира). Современные методы функциональной аннотации используют сохранение последовательностей нуклеотидов и аминокислот (аа) для прогнозирования мутационной патогенности3,4,5. Валидация основана на мутантной дивергенции в боковых цепях аа по сравнению с диким типом и статистической оценке вероятности положительного отбора относительно фоновой частоты мутаций6. Однако изменение консервативного аа не всегда приводит к изменению функции. Алгоритмы, включающие структурную и термодинамическую информацию в функциональные предсказания7,8, ограничены недостатком структурной информации о конформационных и лигандных состояниях белка. Предсказать влияние замены аа на функцию белков в комплексах сложно. Прогнозы улучшаются для хорошо охарактеризованных белков, но такая информация требует дорогостоящей и трудоемкой очистки и характеристики белков. Знание того, какие мутации вызывают рак, имеет решающее значение для определения приоритетности исследований на клетках и животных, но программы функционального прогнозирования не могут надежно направлять эти дорогостоящие эксперименты6,9.
Мы описываем параллельную функциональную аннотацию (PFA) для высокопроизводительной характеристики ассоциированных с раком миссенс-вариантов неопределенного значения (VUS) без очистки белка. Мы демонстрируем ценность PFA с тремя метилтрансферазами гистона H3 лизин 4 (H3K4) семейства лейкемии смешанного происхождения (MLL), которые являются одними из наиболее часто мутирующих генов при раке (рис. S1A)10,11,12,13,14,15, 16,17,18,19,20. Мутации в ферментах семейства MLL связаны с общегеномными аберрациями в паттернах метилирования H3K4, которые связаны с аномальными программами транскрипции, которые способствуют злокачественному новообразованиям18,21,22,23. Из сотен VUS MLL1-3 большинство находится в аминокислотных положениях без известной функции (рис. S1B). Мы проверили 99 миссенс-мутаций, связанных с раком, в доменах каталитического супрессора пестролистности, усилителя зесте, триторакса (SET) или вокруг них, сравнивая результаты с двумя широко используемыми программами функционального прогнозирования. Используя функциональную аннотацию трех паралогов MLL, мы обнаружили, что объединение двух филогенетических параметров и параметров кластеризации повышает точность функционального прогнозирования на основе последовательностей до > 90%. Эти результаты обеспечивают основу для совершенствования вычислительных методов прогнозирования функциональных эффектов мутаций, связанных с раком, для открытия биомаркеров и точной медицины.
Чтобы лучше понять, насколько хорошо прогностические инструменты классифицируют клинически значимые миссенс-мутации в часто мутирующих семействах ферментов, мы функционально проанализировали VUS в каталитических доменах SET MLL1-3 (рис. 1), сравнив результаты с тремя широко используемыми программами компьютерного прогнозирования. Ферменты MLL катализируют метилирование лизина 4 гистона H3 (H3K4)24. Изменения связаны с общегеномными аберрациями метилирования, связанными со злокачественными новообразованиями. MLL1-3 являются одними из наиболее часто мутирующих генов при множественном раке25,26. Из сотен VUS MLL1-3 большинство находится в аминокислотных положениях без известной функции (рис. S1).
50% of WT. Error bars, standard deviation from 2 independent experiments. (C) Representative results from PFA for MLL3 VUS mutations by fluorography of SDS-PAGE. Upper, Coomassie-stained gel of quenched enzymatic reactions; middle, signal from reactions with H3K4me0 (unmethylated) or H3K4me1 (monomethylated) peptides; bottom, expression of MLL3 variants by Coomassie-stained SDS-PAGE. Assays were as described for Fig. 1, limiting the recombinant subunits required for full enzymatic activity31,32,33 to minimize activity variation from differing MLL expression. Rates of monomethylation and dimethylation were determined using unmodified or monomethylated substrates. Activity depended on recombinant expression (no activity in uninduced control, UIC, lane 1). Lanes 2–11 show representative wild-type (WT) and variant MLL3 complexes, demonstrating that activity variation cannot be explained by differential expression. An uncropped version of Fig. 2C is shown in Fig. S11./p> 50% of wild-type with FATHMM scores > − 0.75. The third region representing false-negative (FN) predictions (48% of mutations) had activity < 50% wild-type and FATHMM scores indicating no disease./p> 0.8 "probably damaging", 0.2 to 0.8 "possibly damaging", < 0.2 benign). (C) CancerVar OPAI scores vs. relative activity of VUS. Vertical line,default threshold (< 0.95) for variants with uncertain probability of oncogenicity. (D) Violin plot of mean activity differences between VUS with low (< 1.5) or high (> 1.5) parallel cluster scores (pClustScore). Significance was from 2-tailed unpaired t-tests. Dashed line, median; dotted lines, upper and lower quartiles. (E) Variant ProxRatioEach scores showing proximity of adjacent missense mutations in each protein, plotted as a function of amino acid position using Mixed Lineage Leukemia (MLL) 1 numbering. (F) Clustal Omega phylogenetic cluster analysis of human SET1/MLL proteins shows three clades diverged in product specificity (me1, 2, 3 is degree of methylation)33. (G) Comparison of family vs. versus clade conservation scores in PolyPhen-2 false-positive (FP) and true-positive (TP) amino acid positions. Two-way ANOVA compared means within groups. ****P < 0.0001; ns, P > 0.05./p> 0.8, predicting "probably damaging." Mutations with activity < 50% of wild-type (53.5% of total) represented TP predictions. All but 4 of the remaining (42% of total) with activity > 50% of wild-type represent FP predictions. PoylPhen-2 incorporated structural information into the predictions7, but in contrast to FATHMM, lacked precision to adequately distinguish FP from TN inferences./p> 50% of wild-type represent FP (18%) and TN (29%) predictions./p> 50% of WT. Mut, mutant. (B) Recursive partitioning classification tree for enzymatic activity using FI-score, pClustScore, ΔAtoms, Blosum62 and ΔΔG parameters for MLL1-3 VUS. Circles, internal nodes that can be partitioned into subnodes; boxes, terminal nodes; red, VUS with activity ≤ 50% of WT; blue, VUS with activity > 50% of WT. Circles, P values input nodes; box plots of Activity(MT/WT) values are in terminal nodes. (Goodness of Fit R2 = 0.65, RMSE = 0.22) (C) Confusion matrix showing predictive accuracy of the tree based on the tenfold cross-validation scheme. The recursive partitioning algorithm was repeated85 with 10 rounds of fitting, each using randomly chosen data subsets, with 90% training set and 10% testing set. D-G) Actual vs. Predicted plots. X-axes, actual activity; y-axes, predicted activity based on the regression model. Red diagonal line, line of identity; dashed lines, cutoff for VUS with less than or greater than 50% WT activity. (D) FI-Score and pClustScore parameters as predictors. (E) FATHMM inference score as predictor. (F) PolyPhen-2 inference score as predictor. (G) CancerVar Oncogenic Prioritization by Artificial Intelligence (OPAI) score as predictor. Shown are adjusted R2 values./p> 3.005 were correctly classified as LOF with very low activity (P < 0.001). For VUS variants with FI-Scores ≤ 3.005, pClustScore became the major factor distinguishing high- vs. low-activity variants. Blosum62, ΔAtoms and ΔΔG parameters were not significant. Thus, combining FI-Score and pClustScore was significantly better at predicting the functional impact of VUS mutations (R2 = 0.63) than FATHMM (R2 = 0.0002), PolyPhen-2 (R2 = 0.05) or CancerVar (R2 = 0.001) (Fig. 5D–G)./p> 95% purity. For methyltransferase assays, an equal volume of wild-type or mutant lysate was incubated with 3 µM WRAD, 250 µM H3 peptide (unmodified or monomethylated), and 1–2 µCi [3H]-SAM (PerkinElmer Life Sciences) in assay buffer (20 mM Tris pH 8.5, 1 mM TCEP, 200 mM NaCl, 1 µM ZnCl2). Samples were incubated at 15 °C for 30 min. Lysates from cells transformed with empty vector (pGST II) or uninduced wild-type plasmids served as negative controls. Reactions were quenched with 0.5 M EDTA (1:1, v:v). Quenched reactions were brought to 200 µL using assay buffer with 0.5 M EDTA and 0.2 mg/ml BSA and transferred to 96-well streptavidin-coated FlashPlate microplates (PerkinElmer). Samples were incubated overnight at 4 °C to allow binding of biotinylated H3 peptide to the streptavidin-coated surface before scintillation counting in a Hidex Sense Plus microplate reader (LabLogic). For the gel-based fluorography assays, reactions were quenched with SDS-loading buffer and separated by 4–12% BisTris SDS-PAGE (LifeTechnologies) at 200 V for 30 min. Gels were stained with Coomassie, imaged, then placed in enhancing solution (Enlightening, PerkinElmer Life Sciences) for 30 min at room temperature. Gels were dried for 2.5 h at 72 °C under constant vacuum and exposed to film (Eastman Kodak Co. Biomax MS Film) at − 80 °C for 6–72 h before developing. Densitometry using ChemiDoc ImageLab (BioRad) software was used to quantify H3 peptide methylation./p>