1 Introduction

I am coming into this project in a state of perfect ignorance. Carrie kindly sent me a few or two yesterday but I have yet to open the email and start reading them.

The only things I know for certain:

There are ~ 24 samples with names prefixed with ‘A’ ‘B’ and ‘C’, corresponding to three time point collections at 10.5, 13.5, and 15.5 days. I am going to call these d10,d13,d15.
The most likely reference is the ensembl house mouse mm39; though the real reference is actually the charles river CD-1. I was reasonably certain yesterday that it is possible to download this mouse line’s reference, but I think that is untrue – or at least my attempts to find it failed. At this time I am not certain which samples are which mouse line.
The sequence libraries are likely in the reverse orientation. At least that was my assumption.

The document ‘preprocess.Rmd’ outlines the commands I ran. I used my pipeline’s Process_RNASeq function, which trims, runs fastqc, kraken, hisat, and htseq by default.

2 Metadata

I received a complete sample sheet from either Najib or Carrie and modified it slightly to match the places where I put the raw data. I then copied it to ‘sample_sheets/all_samples.xlsx’ so that I need not worry about messing up the original.

My function ‘gather_preprocessing_metadata()’ has defaults which should provide some helpful new columns in this metadata sheet. Upon completion, it should write a new copy of the same file with a suffix ’_modified.xlsx’.

FIXME: modify the function to detect columns with dates and make sure to keep the encoding the same. FIXED! FIXME: Najib changed his template and added a new first row, add a check against that - or just delete the row manually. FIXED! FIXME: Set the default significant digits back to NULL, having all these darn .000’s is annoying. FIXED!

modified <- gather_preprocessing_metadata("sample_sheets/all_samples.xlsx")

## Did not find the condition column in the sample sheet.

## Filling it in as undefined.

## Did not find the batch column in the sample sheet.

## Filling it in as undefined.

## Skipping for now

## Writing new metadata to: sample_sheets/all_samples_modified.xlsx

## Deleting the file sample_sheets/all_samples_modified.xlsx before writing the tables.

I immediately learned that I somehow forgot to process the first sample!? It is processing now, I have no clue how that happened.

3 Annotations

load_biomart_annotations, if not told anything else, will connect to ensembl and attempt to download the most commonly requested annotations for homo_sapiens from the archive server 2 years before the current date. This is because, as a general rule, I use genomes which are ~ 2-3 years old.

I am also downloading the ontology data, though most tools are aware of Mus.

In addition, I will load the gff annotations from the gff file used to count the genes, just in case there are some mismatches between the ensembl and gff gene IDs.

annot <- load_biomart_annotations(species = "mmusculus", year = 2022, month = 7)

## The biomart annotations file already exists, loading from it.

gene_annotations <- annot[["gene_annotations"]]

go_db <- load_biomart_go(species = "mmusculus", year = 2022, month = 7)

## The biomart annotations file already exists, loading from it.

gff_annot <- load_gff_annotations("~/libraries/genome/mm38_100.gff", id_col = "gene_id")

## Returning a df with 32 columns and 3899382 rows.

4 Initial expressionset

The experimental metadata now includes the count table filenames and I have a reasonable set of gene annotations. I should be able therefore the merge them all into an expressionset and/or summarizedExperiment.

mm_expt <- create_expt(modified[["new_file"]],
                       gene_info = gene_annotations,
                       annotation = "org.Mm.eg.db",
                       file_column = "hisatcounttable") %>%
  set_expt_conditions(fact = "time") %>%
  set_expt_batches(fact = "datecategorical")

## Reading the sample metadata.

## The sample definitions comprises: 17 rows(samples) and 46 columns(metadata fields).

## Matched 25760 annotations and counts.

## Bringing together the count matrix and gene information.

## Saving the expressionset to 'expt.rda'.

## The final expressionset has 25760 features and 17 samples.

## The numbers of samples by condition are:

## 
## d10 d13 d15 
##   5   6   6

## The number of samples by batch are:

## 
## b1 b2 b3 b4 
## 11  2  2  2

written <- write_expt(expt, excel = glue("excel/all_samples-v{ver}.xlsx"))

## Error in (function (classes, fdef, mtable) : unable to find an inherited method for function 'exprs' for signature '"function"'

5 Poke at it

plot_libsize(mm_expt)

## Library sizes of 17 samples, 
## ranging from 27,324,171 to 69,203,380.

plot_nonzero(mm_expt)

## The following samples have less than 16744 genes.

## [1] "A1" "A2" "A5" "B1" "B3" "B4"

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.

## Scale for fill is already present.
## Adding another scale for fill, which will replace the existing scale.
## A non-zero genes plot of 17 samples.
## These samples have an average 37.06 CPM coverage and 16818 genes observed, ranging from 16399 to
## 17275.

norm <- normalize_expt(mm_expt, transform = "log2", convert = "cpm",
                       norm = "quant", filter = TRUE)

## Removing 12303 low-count genes (13457 remaining).
## transform_counts: Found 57 values equal to 0, adding 1 to the matrix.

plot_corheat(norm)

## A heatmap of pairwise sample correlations ranging from: 
## 0.745893022508784 to 0.996487658158264.

plot_disheat(norm)

## A heatmap of pairwise sample distances ranging from: 
## 19.647203152876 to 167.113181354411.

plot_pca(norm)

## The result of performing a fast_svd dimension reduction.
## The x-axis is PC1 and the y-axis is PC2
## Colors are defined by d10, d13, d15
## Shapes are defined by b1, b2, b3, b4.

Holy ass crackers! I am not sure I have ever had a dataset which split this coherently. I need better names than ‘A’ ‘B’ ‘C’.

Ok, I will just do a no-batch DE because I am not sure of the actual batches and/or surrogates, and who cares the data split so well I am worried (not really) it is simulated.

Oh, before I forget, April has been asking about rRNA content. I think I quantified that?

5.1 Check the rRNA content

No, it appears I didn’t submit rRNA queries. Lets do that now before I forget.

cd preprocessing
start=$(pwd)
for i in A* B* C*; do
    cd $i
    cyoa --method hisat --species mm38_100 --libtype rRNA --gff_type misc_feature --gff_tag ID \
         --input $(/bin/ls *-trimmed.fastq.xz | tr '\n' ':' | sed 's/:$//g')
    cd $start
done

I checked the logs for a few samples and it looks like the rRNA content is less than 1% in most(all?) of the samples.

6 varpart

varpart <- simple_varpart(mm_expt)

## Subsetting on genes.

## remove_genes_expt(), before removal, there were 18857 genes, now there are 17392.

## 
## Total:175 s

varpart

## The result of using variancePartition with the model:
## ~ condition + batch

7 GSVA

Since I have not read the kindly-sent reviews, I will cheat a little and use GSVA to get some ideas about potential papers. I default to C2 which is likely not the right gene set list.

I just downloaded the new msigdb, let us use that instead of the much less interesting GSVAdata set. Frustratingly, the new version of MSigDB provides invalid XML (there are apparently ‘<’ characters in the text fields of this file, which is explicitly forbidden in the XML standard), so I wrote a function to read the annotations from the SQLite database.

FIXME: I need to do some work to clean up the IDs with this new function.

mm_gsva <- simple_gsva(mm_expt, orgdb = "org.Mm.eg.db", signature_category = "c2",
                       msig_db =  "reference/msigdb_v2023.2.Mm/msigdb_v2023.2.Mm.db",
                       signatures = "reference/msigdb_v2023.2.Mm/m2.all.v2023.2.Mm.entrez.gmt")

## Converting the rownames() of the expressionset to ENTREZID.

## 4032 ENSEMBL ID's didn't have a matching ENTEREZ ID. Dropping them now.

## Before conversion, the expressionset has 25760 entries.

## Subsetting on genes.

## remove_genes_expt(), before removal, there were 25760 genes, now there are 21669.

## After conversion, the expressionset has 21669 entries.

## Adding descriptions and IDs to the gene set annotations.

## Adding annotations from reference/msigdb_v2023.2.Mm/msigdb_v2023.2.Mm.db.

## Not subsetting the msigdb metadata, the wanted_meta argument was NULL.

mm_gsva

## GSVA result using method: ssgsea against the c2 dataset.
## Scores range from: -0.4357 to: 0.5643.

mm_gsva_sig <- get_sig_gsva_categories(mm_gsva)

## Starting limma pairwise comparison.

## libsize was not specified, this parameter has profound effects on limma's result.

## Using the libsize from expt$libsize.

## Limma step 1/6: choosing model.

## Assuming this data is similar to a micro array and not performign voom.

## Limma step 3/6: running lmFit with method: ls.

## Limma step 4/6: making and fitting contrasts with no intercept. (~ 0 + factors)

## Limma step 5/6: Running eBayes with robust = FALSE and trend = FALSE.

## Limma step 6/6: Writing limma outputs.

## Limma step 6/6: 1/3: Creating table: d13_vs_d10.  Adjust = BH

## Limma step 6/6: 2/3: Creating table: d15_vs_d10.  Adjust = BH

## Limma step 6/6: 3/3: Creating table: d15_vs_d13.  Adjust = BH

## Limma step 6/6: 1/3: Creating table: d10.  Adjust = BH

## Limma step 6/6: 2/3: Creating table: d13.  Adjust = BH

## Limma step 6/6: 3/3: Creating table: d15.  Adjust = BH

## The factor d10 has 5 rows.

## The factor d13 has 6 rows.

## The factor d15 has 6 rows.

## Testing each factor against the others.

## Scoring d10 against everything else.

## Scoring d13 against everything else.

## Scoring d15 against everything else.

## Deleting the file excel/gsva_subset.xlsx before writing the tables.

mm_gsva_sig

## The set of GSVA categories deemed significantly higher than the
## distribution of all scores.  It comprises 54 gene sets.

mm_gsva_sig$score_pca

8 Kraken matrix

Come back to this, note to self the previous iteration was explicitly looking for Pseudomonas contamination.

genus_expt <- create_expt(gathered[["new_file"]],
                          file_column = "krakenmatrix", file_type = "table")
genus_norm <- normalize_expt(genus_expt, convert = "cpm")
plot_disheat(genus_norm)
genus_normv2 <- normalize_expt(genus_expt, convert = "cpm", transform = "log2")
plot_pca(genus_normv2)
plot_libsize(genus_expt)
head(exprs(genus_expt))
exprs(genus_expt)["Pseudomonas", ]

9 Differential Expression

Until I get more meaningful condition names, I will just do B/A C/A C/B

keepers <- list(
  "d13_vs_d10" = c("d13", "d10"),
  "d15_vs_d10" = c("d15", "d10"),
  "d15_vs_d13" = c("d15", "d13"))
de <- all_pairwise(mm_expt, filter = TRUE, model_batch = FALSE)

## 
## d10 d13 d15 
##   5   6   6

tables <- combine_de_tables(
  de, keepers = keepers, excel = glue("excel/de_tables-v{ver}.xlsx"))

## Deleting the file excel/de_tables-v20240206.xlsx before writing the tables.

sig <- extract_significant_genes(
  tables, according_to = "deseq", excel = glue("excel/de_sig-v{ver}.xlsx"))

## Deleting the file excel/de_sig-v20240206.xlsx before writing the tables.

10 Ontology enrichment

mm38 is nicely supported in gProfiler/clusterProfiler.

all_gp <- all_gprofiler(sig, species = "mmusculus")
all_gp

## Running gProfiler on every set of significant genes found:

##                   GO KEGG REAC WP  TF MIRNA HPA CORUM HP
## d13_vs_d10_up   1329    4   14  2 483     0   0     0  0
## d13_vs_d10_down 1296    9   58  1 407     0   0     0  0
## d15_vs_d10_up   1484    5    9  0 524     0   0     0  0
## d15_vs_d10_down 1374   11   80  2 489     0   0     0  0
## d15_vs_d13_up    656    3    3  0 146     0   0     0  1
## d15_vs_d13_down  168    0    0  0  36     0   0     0  0

all_gp[["d13_vs_d10_up"]]

## A set of ontologies produced by gprofiler using 2437
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1329 GO hits, 4, KEGG hits, 14 reactome hits, 2 wikipathway hits, 483 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.

## Category MF is the most populated with 30 hits.

all_gp[["d13_vs_d10_down"]]

## A set of ontologies produced by gprofiler using 1497
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1296 GO hits, 9, KEGG hits, 58 reactome hits, 1 wikipathway hits, 407 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d10_up"]]

## A set of ontologies produced by gprofiler using 2916
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1484 GO hits, 5, KEGG hits, 9 reactome hits, 0 wikipathway hits, 524 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d10_down"]]

## A set of ontologies produced by gprofiler using 1840
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1374 GO hits, 11, KEGG hits, 80 reactome hits, 2 wikipathway hits, 489 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d13_up"]]

## A set of ontologies produced by gprofiler using 753
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 656 GO hits, 3, KEGG hits, 3 reactome hits, 0 wikipathway hits, 146 transcription factor hits, 0 miRNA hits, 0 HPA hits, 1 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d13_down"]]

## A set of ontologies produced by gprofiler using 199
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 168 GO hits, 0, KEGG hits, 0 reactome hits, 0 wikipathway hits, 36 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.

## Category BP is the most populated with 30 hits.

## all_cp <- all_clusterprofiler(sig, species = "mmusculus")

LS0tCnRpdGxlOiAiRXhhbWluaW5nIGFuIGV4cGVyaW1lbnQgaW4gbW91c2UgZW1icnlvZ2VuZXNpcy4iCmF1dGhvcjogImF0YiBhYmVsZXdAZ21haWwuY29tIgpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICAgY29kZV9kb3dubG9hZDogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93CiAgICBmaWdfY2FwdGlvbjogdHJ1ZQogICAgZmlnX2hlaWdodDogNwogICAgZmlnX3dpZHRoOiA3CiAgICBoaWdobGlnaHQ6IHplbmJ1cm4KICAgIGtlZXBfbWQ6IGZhbHNlCiAgICBtb2RlOiBzZWxmY29udGFpbmVkCiAgICBudW1iZXJfc2VjdGlvbnM6IHRydWUKICAgIHNlbGZfY29udGFpbmVkOiB0cnVlCiAgICB0aGVtZTogcmVhZGFibGUKICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OgogICAgICBjb2xsYXBzZWQ6IGZhbHNlCiAgICAgIHNtb290aF9zY3JvbGw6IGZhbHNlCiAgcm1kZm9ybWF0czo6cmVhZHRoZWRvd246CiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCiAgICBjb2RlX2ZvbGRpbmc6IHNob3cKICAgIGRmX3ByaW50OiBwYWdlZAogICAgZmlnX2NhcHRpb246IHRydWUKICAgIGZpZ19oZWlnaHQ6IDcKICAgIGZpZ193aWR0aDogNwogICAgaGlnaGxpZ2h0OiB6ZW5idXJuCiAgICB3aWR0aDogMzAwCiAgICBrZWVwX21kOiBmYWxzZQogICAgbW9kZTogc2VsZmNvbnRhaW5lZAogICAgdG9jX2Zsb2F0OiB0cnVlCiAgQmlvY1N0eWxlOjpodG1sX2RvY3VtZW50OgogICAgY29kZV9kb3dubG9hZDogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93CiAgICBmaWdfY2FwdGlvbjogdHJ1ZQogICAgZmlnX2hlaWdodDogNwogICAgZmlnX3dpZHRoOiA3CiAgICBoaWdobGlnaHQ6IHplbmJ1cm4KICAgIGtlZXBfbWQ6IGZhbHNlCiAgICBtb2RlOiBzZWxmY29udGFpbmVkCiAgICB0b2NfZmxvYXQ6IHRydWUKLS0tCgo8c3R5bGUgdHlwZT0idGV4dC9jc3MiPgpib2R5LCB0ZCB7CiAgZm9udC1zaXplOiAxNnB4Owp9CmNvZGUucnsKICBmb250LXNpemU6IDE2cHg7Cn0KcHJlIHsKIGZvbnQtc2l6ZTogMTZweAp9CmJvZHkgLm1haW4tY29udGFpbmVyIHsKICBtYXgtd2lkdGg6IDE2MDBweDsKfQo8L3N0eWxlPgoKYGBge3Igb3B0aW9ucywgaW5jbHVkZT1GQUxTRX0KbGlicmFyeShocGdsdG9vbHMpCmxpYnJhcnkoaHBnbGRhdGEpCmxpYnJhcnkocmV0aWN1bGF0ZSkKbGlicmFyeShnbHVlKQp0dCA8LSBkZXZ0b29sczo6bG9hZF9hbGwoIn4vaHBnbHRvb2xzIikKa25pdHI6Om9wdHNfa25pdCRzZXQoCiAgcHJvZ3Jlc3MgPSBUUlVFLCB2ZXJib3NlID0gVFJVRSwgd2lkdGggPSA5MCwgZWNobyA9IFRSVUUpCmtuaXRyOjpvcHRzX2NodW5rJHNldCgKICBlcnJvciA9IFRSVUUsIGZpZy53aWR0aCA9IDgsIGZpZy5oZWlnaHQgPSA4LCBmaWcucmV0aW5hID0gMiwKICBmaWcucG9zID0gInQiLCBmaWcuYWxpZ24gPSAiY2VudGVyIiwgZHBpID0gaWYgKGtuaXRyOjppc19sYXRleF9vdXRwdXQoKSkgNzIgZWxzZSAzMDAsCiAgb3V0LndpZHRoID0gIjEwMCUiLCBkZXYgPSAicG5nIiwKICBkZXYuYXJncyA9IGxpc3QocG5nID0gbGlzdCh0eXBlID0gImNhaXJvLXBuZyIpKSkKb2xkX29wdGlvbnMgPC0gb3B0aW9ucyhkaWdpdHMgPSA0LAogICAgICAgICAgICAgICAgICAgICAgIHN0cmluZ3NBc0ZhY3RvcnMgPSBGQUxTRSwKICAgICAgICAgICAgICAgICAgICAgICBrbml0ci5kdXBsaWNhdGUubGFiZWwgPSAiYWxsb3ciKQpnZ3Bsb3QyOjp0aGVtZV9zZXQoZ2dwbG90Mjo6dGhlbWVfYncoYmFzZV9zaXplID0gMTIpKQp2ZXIgPC0gIjIwMjQwMSIKcHJldmlvdXNfZmlsZSA8LSAiIgp2ZXIgPC0gZm9ybWF0KFN5cy5EYXRlKCksICIlWSVtJWQiKQoKIyN0bXAgPC0gc20obG9hZG1lKGZpbGVuYW1lPXBhc3RlMChnc3ViKHBhdHRlcm49IlxcLlJtZCIsIHJlcGxhY2U9IiIsIHg9cHJldmlvdXNfZmlsZSksICItdiIsIHZlciwgIi5yZGEueHoiKSkpCnJtZF9maWxlIDwtICJpbmRleC5SbWQiCmBgYAoKIyBJbnRyb2R1Y3Rpb24KCkkgYW0gY29taW5nIGludG8gdGhpcyBwcm9qZWN0IGluIGEgc3RhdGUgb2YgcGVyZmVjdCBpZ25vcmFuY2UuICBDYXJyaWUKa2luZGx5IHNlbnQgbWUgYSBmZXcgb3IgdHdvIHllc3RlcmRheSBidXQgSSBoYXZlIHlldCB0byBvcGVuIHRoZSBlbWFpbAphbmQgc3RhcnQgcmVhZGluZyB0aGVtLgoKVGhlIG9ubHkgdGhpbmdzIEkga25vdyBmb3IgY2VydGFpbjoKCjEuICBUaGVyZSBhcmUgfiAyNCBzYW1wbGVzIHdpdGggbmFtZXMgcHJlZml4ZWQgd2l0aCAnQScgJ0InIGFuZCAnQycsCiAgICBjb3JyZXNwb25kaW5nIHRvIHRocmVlIHRpbWUgcG9pbnQgY29sbGVjdGlvbnMgYXQgMTAuNSwgMTMuNSwgYW5kCiAgICAxNS41IGRheXMuICBJIGFtIGdvaW5nIHRvIGNhbGwgdGhlc2UgZDEwLGQxMyxkMTUuCjIuICBUaGUgbW9zdCBsaWtlbHkgcmVmZXJlbmNlIGlzIHRoZSBlbnNlbWJsIGhvdXNlIG1vdXNlIG1tMzk7IHRob3VnaAogICAgdGhlIHJlYWwgcmVmZXJlbmNlIGlzIGFjdHVhbGx5IHRoZSBjaGFybGVzIHJpdmVyIENELTEuICBJIHdhcwogICAgcmVhc29uYWJseSBjZXJ0YWluIHllc3RlcmRheSB0aGF0IGl0IGlzIHBvc3NpYmxlIHRvIGRvd25sb2FkIHRoaXMKICAgIG1vdXNlIGxpbmUncyByZWZlcmVuY2UsIGJ1dCBJIHRoaW5rIHRoYXQgaXMgdW50cnVlIC0tIG9yIGF0IGxlYXN0CiAgICBteSBhdHRlbXB0cyB0byBmaW5kIGl0IGZhaWxlZC4gIEF0IHRoaXMgdGltZSBJIGFtIG5vdCBjZXJ0YWluCiAgICB3aGljaCBzYW1wbGVzIGFyZSB3aGljaCBtb3VzZSBsaW5lLgozLiAgVGhlIHNlcXVlbmNlIGxpYnJhcmllcyBhcmUgbGlrZWx5IGluIHRoZSByZXZlcnNlIG9yaWVudGF0aW9uLiAgQXQKICAgIGxlYXN0IHRoYXQgd2FzIG15IGFzc3VtcHRpb24uCgpUaGUgZG9jdW1lbnQgJ3ByZXByb2Nlc3MuUm1kJyBvdXRsaW5lcyB0aGUgY29tbWFuZHMgSSByYW4uICBJIHVzZWQgbXkKcGlwZWxpbmUncyBQcm9jZXNzX1JOQVNlcSBmdW5jdGlvbiwgd2hpY2ggdHJpbXMsIHJ1bnMgZmFzdHFjLCBrcmFrZW4sCmhpc2F0LCBhbmQgaHRzZXEgYnkgZGVmYXVsdC4KCiMgTWV0YWRhdGEKCkkgcmVjZWl2ZWQgYSBjb21wbGV0ZSBzYW1wbGUgc2hlZXQgZnJvbSBlaXRoZXIgTmFqaWIgb3IgQ2FycmllIGFuZAptb2RpZmllZCBpdCBzbGlnaHRseSB0byBtYXRjaCB0aGUgcGxhY2VzIHdoZXJlIEkgcHV0IHRoZSByYXcgZGF0YS4gIEkKdGhlbiBjb3BpZWQgaXQgdG8gJ3NhbXBsZV9zaGVldHMvYWxsX3NhbXBsZXMueGxzeCcgc28gdGhhdCBJIG5lZWQgbm90CndvcnJ5IGFib3V0IG1lc3NpbmcgdXAgdGhlIG9yaWdpbmFsLgoKTXkgZnVuY3Rpb24gJ2dhdGhlcl9wcmVwcm9jZXNzaW5nX21ldGFkYXRhKCknIGhhcyBkZWZhdWx0cyB3aGljaApzaG91bGQgcHJvdmlkZSBzb21lIGhlbHBmdWwgbmV3IGNvbHVtbnMgaW4gdGhpcyBtZXRhZGF0YSBzaGVldC4gIFVwb24KY29tcGxldGlvbiwgaXQgc2hvdWxkIHdyaXRlIGEgbmV3IGNvcHkgb2YgdGhlIHNhbWUgZmlsZSB3aXRoIGEgc3VmZml4CidfbW9kaWZpZWQueGxzeCcuCgpGSVhNRTogbW9kaWZ5IHRoZSBmdW5jdGlvbiB0byBkZXRlY3QgY29sdW1ucyB3aXRoIGRhdGVzIGFuZCBtYWtlIHN1cmUKdG8ga2VlcCB0aGUgZW5jb2RpbmcgdGhlIHNhbWUuIEZJWEVEIQpGSVhNRTogTmFqaWIgY2hhbmdlZCBoaXMgdGVtcGxhdGUgYW5kIGFkZGVkIGEgbmV3IGZpcnN0IHJvdywgYWRkIGEKY2hlY2sgYWdhaW5zdCB0aGF0IC0gb3IganVzdCBkZWxldGUgdGhlIHJvdyBtYW51YWxseS4gRklYRUQhCkZJWE1FOiBTZXQgdGhlIGRlZmF1bHQgc2lnbmlmaWNhbnQgZGlnaXRzIGJhY2sgdG8gTlVMTCwgaGF2aW5nIGFsbAp0aGVzZSBkYXJuIC4wMDAncyBpcyBhbm5veWluZy4gRklYRUQhCgpgYGB7cn0KbW9kaWZpZWQgPC0gZ2F0aGVyX3ByZXByb2Nlc3NpbmdfbWV0YWRhdGEoInNhbXBsZV9zaGVldHMvYWxsX3NhbXBsZXMueGxzeCIpCmBgYAoKSSBpbW1lZGlhdGVseSBsZWFybmVkIHRoYXQgSSBzb21laG93IGZvcmdvdCB0byBwcm9jZXNzIHRoZSBmaXJzdApzYW1wbGUhPyBJdCBpcyBwcm9jZXNzaW5nIG5vdywgSSBoYXZlIG5vIGNsdWUgaG93IHRoYXQgaGFwcGVuZWQuCgojIEFubm90YXRpb25zCgpsb2FkX2Jpb21hcnRfYW5ub3RhdGlvbnMsIGlmIG5vdCB0b2xkIGFueXRoaW5nIGVsc2UsIHdpbGwgY29ubmVjdCB0bwplbnNlbWJsIGFuZCBhdHRlbXB0IHRvIGRvd25sb2FkIHRoZSBtb3N0IGNvbW1vbmx5IHJlcXVlc3RlZAphbm5vdGF0aW9ucyBmb3IgaG9tb19zYXBpZW5zIGZyb20gdGhlIGFyY2hpdmUgc2VydmVyIDIgeWVhcnMgYmVmb3JlCnRoZSBjdXJyZW50IGRhdGUuICBUaGlzIGlzIGJlY2F1c2UsIGFzIGEgZ2VuZXJhbCBydWxlLCBJIHVzZSBnZW5vbWVzCndoaWNoIGFyZSB+IDItMyB5ZWFycyBvbGQuCgpJIGFtIGFsc28gZG93bmxvYWRpbmcgdGhlIG9udG9sb2d5IGRhdGEsIHRob3VnaCBtb3N0IHRvb2xzIGFyZSBhd2FyZQpvZiBNdXMuCgpJbiBhZGRpdGlvbiwgSSB3aWxsIGxvYWQgdGhlIGdmZiBhbm5vdGF0aW9ucyBmcm9tIHRoZSBnZmYgZmlsZSB1c2VkIHRvCmNvdW50IHRoZSBnZW5lcywganVzdCBpbiBjYXNlIHRoZXJlIGFyZSBzb21lIG1pc21hdGNoZXMgYmV0d2VlbiB0aGUKZW5zZW1ibCBhbmQgZ2ZmIGdlbmUgSURzLgoKYGBge3J9CmFubm90IDwtIGxvYWRfYmlvbWFydF9hbm5vdGF0aW9ucyhzcGVjaWVzID0gIm1tdXNjdWx1cyIsIHllYXIgPSAyMDIyLCBtb250aCA9IDcpCmdlbmVfYW5ub3RhdGlvbnMgPC0gYW5ub3RbWyJnZW5lX2Fubm90YXRpb25zIl1dCgpnb19kYiA8LSBsb2FkX2Jpb21hcnRfZ28oc3BlY2llcyA9ICJtbXVzY3VsdXMiLCB5ZWFyID0gMjAyMiwgbW9udGggPSA3KQoKZ2ZmX2Fubm90IDwtIGxvYWRfZ2ZmX2Fubm90YXRpb25zKCJ+L2xpYnJhcmllcy9nZW5vbWUvbW0zOF8xMDAuZ2ZmIiwgaWRfY29sID0gImdlbmVfaWQiKQpgYGAKCiMgSW5pdGlhbCBleHByZXNzaW9uc2V0CgpUaGUgZXhwZXJpbWVudGFsIG1ldGFkYXRhIG5vdyBpbmNsdWRlcyB0aGUgY291bnQgdGFibGUgZmlsZW5hbWVzIGFuZCBJCmhhdmUgYSByZWFzb25hYmxlIHNldCBvZiBnZW5lIGFubm90YXRpb25zLiAgSSBzaG91bGQgYmUgYWJsZSB0aGVyZWZvcmUKdGhlIG1lcmdlIHRoZW0gYWxsIGludG8gYW4gZXhwcmVzc2lvbnNldCBhbmQvb3Igc3VtbWFyaXplZEV4cGVyaW1lbnQuCgpgYGB7cn0KbW1fZXhwdCA8LSBjcmVhdGVfZXhwdChtb2RpZmllZFtbIm5ld19maWxlIl1dLAogICAgICAgICAgICAgICAgICAgICAgIGdlbmVfaW5mbyA9IGdlbmVfYW5ub3RhdGlvbnMsCiAgICAgICAgICAgICAgICAgICAgICAgYW5ub3RhdGlvbiA9ICJvcmcuTW0uZWcuZGIiLAogICAgICAgICAgICAgICAgICAgICAgIGZpbGVfY29sdW1uID0gImhpc2F0Y291bnR0YWJsZSIpICU+JQogIHNldF9leHB0X2NvbmRpdGlvbnMoZmFjdCA9ICJ0aW1lIikgJT4lCiAgc2V0X2V4cHRfYmF0Y2hlcyhmYWN0ID0gImRhdGVjYXRlZ29yaWNhbCIpCgp3cml0dGVuIDwtIHdyaXRlX2V4cHQoZXhwdCwgZXhjZWwgPSBnbHVlKCJleGNlbC9hbGxfc2FtcGxlcy12e3Zlcn0ueGxzeCIpKQpgYGAKCiMgUG9rZSBhdCBpdAoKYGBge3J9CnBsb3RfbGlic2l6ZShtbV9leHB0KQpwbG90X25vbnplcm8obW1fZXhwdCkKCm5vcm0gPC0gbm9ybWFsaXplX2V4cHQobW1fZXhwdCwgdHJhbnNmb3JtID0gImxvZzIiLCBjb252ZXJ0ID0gImNwbSIsCiAgICAgICAgICAgICAgICAgICAgICAgbm9ybSA9ICJxdWFudCIsIGZpbHRlciA9IFRSVUUpCnBsb3RfY29yaGVhdChub3JtKQpwbG90X2Rpc2hlYXQobm9ybSkKcGxvdF9wY2Eobm9ybSkKYGBgCgpIb2x5IGFzcyBjcmFja2VycyEgIEkgYW0gbm90IHN1cmUgSSBoYXZlIGV2ZXIgaGFkIGEgZGF0YXNldCB3aGljaApzcGxpdCB0aGlzIGNvaGVyZW50bHkuICBJIG5lZWQgYmV0dGVyIG5hbWVzIHRoYW4gJ0EnICdCJyAnQycuCgpPaywgSSB3aWxsIGp1c3QgZG8gYSBuby1iYXRjaCBERSBiZWNhdXNlIEkgYW0gbm90IHN1cmUgb2YgdGhlIGFjdHVhbApiYXRjaGVzIGFuZC9vciBzdXJyb2dhdGVzLCBhbmQgd2hvIGNhcmVzIHRoZSBkYXRhIHNwbGl0IHNvIHdlbGwgSSBhbQp3b3JyaWVkIChub3QgcmVhbGx5KSBpdCBpcyBzaW11bGF0ZWQuCgpPaCwgYmVmb3JlIEkgZm9yZ2V0LCBBcHJpbCBoYXMgYmVlbiBhc2tpbmcgYWJvdXQgclJOQSBjb250ZW50LiAgSQp0aGluayBJIHF1YW50aWZpZWQgdGhhdD8KCiMjIENoZWNrIHRoZSByUk5BIGNvbnRlbnQKCk5vLCBpdCBhcHBlYXJzIEkgZGlkbid0IHN1Ym1pdCByUk5BIHF1ZXJpZXMuICBMZXRzIGRvIHRoYXQgbm93IGJlZm9yZQpJIGZvcmdldC4KCmBgYHtiYXNoLCBldmFsPUZBTFNFfQpjZCBwcmVwcm9jZXNzaW5nCnN0YXJ0PSQocHdkKQpmb3IgaSBpbiBBKiBCKiBDKjsgZG8KICAgIGNkICRpCiAgICBjeW9hIC0tbWV0aG9kIGhpc2F0IC0tc3BlY2llcyBtbTM4XzEwMCAtLWxpYnR5cGUgclJOQSAtLWdmZl90eXBlIG1pc2NfZmVhdHVyZSAtLWdmZl90YWcgSUQgXAogICAgICAgICAtLWlucHV0ICQoL2Jpbi9scyAqLXRyaW1tZWQuZmFzdHEueHogfCB0ciAnXG4nICc6JyB8IHNlZCAncy86JC8vZycpCiAgICBjZCAkc3RhcnQKZG9uZQpgYGAKCkkgY2hlY2tlZCB0aGUgbG9ncyBmb3IgYSBmZXcgc2FtcGxlcyBhbmQgaXQgbG9va3MgbGlrZSB0aGUgclJOQQpjb250ZW50IGlzIGxlc3MgdGhhbiAxJSBpbiBtb3N0KGFsbD8pIG9mIHRoZSBzYW1wbGVzLgoKIyB2YXJwYXJ0CgpgYGB7cn0KdmFycGFydCA8LSBzaW1wbGVfdmFycGFydChtbV9leHB0KQp2YXJwYXJ0CmBgYAoKIyBHU1ZBCgpTaW5jZSBJIGhhdmUgbm90IHJlYWQgdGhlIGtpbmRseS1zZW50IHJldmlld3MsIEkgd2lsbCBjaGVhdCBhIGxpdHRsZQphbmQgdXNlIEdTVkEgdG8gZ2V0IHNvbWUgaWRlYXMgYWJvdXQgcG90ZW50aWFsIHBhcGVycy4gIEkgZGVmYXVsdCB0bwpDMiB3aGljaCBpcyBsaWtlbHkgbm90IHRoZSByaWdodCBnZW5lIHNldCBsaXN0LgoKSSBqdXN0IGRvd25sb2FkZWQgdGhlIG5ldyBtc2lnZGIsIGxldCB1cyB1c2UgdGhhdCBpbnN0ZWFkIG9mIHRoZSBtdWNoCmxlc3MgaW50ZXJlc3RpbmcgR1NWQWRhdGEgc2V0LiAgRnJ1c3RyYXRpbmdseSwgdGhlIG5ldyB2ZXJzaW9uIG9mCk1TaWdEQiBwcm92aWRlcyBpbnZhbGlkIFhNTCAodGhlcmUgYXJlIGFwcGFyZW50bHkgJzwnIGNoYXJhY3RlcnMgaW4KdGhlIHRleHQgZmllbGRzIG9mIHRoaXMgZmlsZSwgd2hpY2ggaXMgZXhwbGljaXRseSBmb3JiaWRkZW4gaW4gdGhlIFhNTApzdGFuZGFyZCksIHNvIEkgd3JvdGUgYSBmdW5jdGlvbiB0byByZWFkIHRoZSBhbm5vdGF0aW9ucyBmcm9tIHRoZQpTUUxpdGUgZGF0YWJhc2UuCgpGSVhNRTogSSBuZWVkIHRvIGRvIHNvbWUgd29yayB0byBjbGVhbiB1cCB0aGUgSURzIHdpdGggdGhpcyBuZXcKZnVuY3Rpb24uCgpgYGB7cn0KbW1fZ3N2YSA8LSBzaW1wbGVfZ3N2YShtbV9leHB0LCBvcmdkYiA9ICJvcmcuTW0uZWcuZGIiLCBzaWduYXR1cmVfY2F0ZWdvcnkgPSAiYzIiLAogICAgICAgICAgICAgICAgICAgICAgIG1zaWdfZGIgPSAgInJlZmVyZW5jZS9tc2lnZGJfdjIwMjMuMi5NbS9tc2lnZGJfdjIwMjMuMi5NbS5kYiIsCiAgICAgICAgICAgICAgICAgICAgICAgc2lnbmF0dXJlcyA9ICJyZWZlcmVuY2UvbXNpZ2RiX3YyMDIzLjIuTW0vbTIuYWxsLnYyMDIzLjIuTW0uZW50cmV6LmdtdCIpCm1tX2dzdmEKCm1tX2dzdmFfc2lnIDwtIGdldF9zaWdfZ3N2YV9jYXRlZ29yaWVzKG1tX2dzdmEpCm1tX2dzdmFfc2lnCm1tX2dzdmFfc2lnJHNjb3JlX3BjYQpgYGAKCiMgS3Jha2VuIG1hdHJpeAoKQ29tZSBiYWNrIHRvIHRoaXMsIG5vdGUgdG8gc2VsZiB0aGUgcHJldmlvdXMgaXRlcmF0aW9uIHdhcyBleHBsaWNpdGx5Cmxvb2tpbmcgZm9yIFBzZXVkb21vbmFzIGNvbnRhbWluYXRpb24uCgpgYGB7ciwgZXZhbD1GQUxTRX0KZ2VudXNfZXhwdCA8LSBjcmVhdGVfZXhwdChnYXRoZXJlZFtbIm5ld19maWxlIl1dLAogICAgICAgICAgICAgICAgICAgICAgICAgIGZpbGVfY29sdW1uID0gImtyYWtlbm1hdHJpeCIsIGZpbGVfdHlwZSA9ICJ0YWJsZSIpCmdlbnVzX25vcm0gPC0gbm9ybWFsaXplX2V4cHQoZ2VudXNfZXhwdCwgY29udmVydCA9ICJjcG0iKQpwbG90X2Rpc2hlYXQoZ2VudXNfbm9ybSkKZ2VudXNfbm9ybXYyIDwtIG5vcm1hbGl6ZV9leHB0KGdlbnVzX2V4cHQsIGNvbnZlcnQgPSAiY3BtIiwgdHJhbnNmb3JtID0gImxvZzIiKQpwbG90X3BjYShnZW51c19ub3JtdjIpCnBsb3RfbGlic2l6ZShnZW51c19leHB0KQpoZWFkKGV4cHJzKGdlbnVzX2V4cHQpKQpleHBycyhnZW51c19leHB0KVsiUHNldWRvbW9uYXMiLCBdCmBgYAoKIyBEaWZmZXJlbnRpYWwgRXhwcmVzc2lvbgoKVW50aWwgSSBnZXQgbW9yZSBtZWFuaW5nZnVsIGNvbmRpdGlvbiBuYW1lcywgSSB3aWxsIGp1c3QgZG8gQi9BIEMvQQpDL0IKCmBgYHtyfQprZWVwZXJzIDwtIGxpc3QoCiAgImQxM192c19kMTAiID0gYygiZDEzIiwgImQxMCIpLAogICJkMTVfdnNfZDEwIiA9IGMoImQxNSIsICJkMTAiKSwKICAiZDE1X3ZzX2QxMyIgPSBjKCJkMTUiLCAiZDEzIikpCmRlIDwtIGFsbF9wYWlyd2lzZShtbV9leHB0LCBmaWx0ZXIgPSBUUlVFLCBtb2RlbF9iYXRjaCA9IEZBTFNFKQp0YWJsZXMgPC0gY29tYmluZV9kZV90YWJsZXMoCiAgZGUsIGtlZXBlcnMgPSBrZWVwZXJzLCBleGNlbCA9IGdsdWUoImV4Y2VsL2RlX3RhYmxlcy12e3Zlcn0ueGxzeCIpKQpzaWcgPC0gZXh0cmFjdF9zaWduaWZpY2FudF9nZW5lcygKICB0YWJsZXMsIGFjY29yZGluZ190byA9ICJkZXNlcSIsIGV4Y2VsID0gZ2x1ZSgiZXhjZWwvZGVfc2lnLXZ7dmVyfS54bHN4IikpCmBgYAoKIyBPbnRvbG9neSBlbnJpY2htZW50CgptbTM4IGlzIG5pY2VseSBzdXBwb3J0ZWQgaW4gZ1Byb2ZpbGVyL2NsdXN0ZXJQcm9maWxlci4KCmBgYHtyfQphbGxfZ3AgPC0gYWxsX2dwcm9maWxlcihzaWcsIHNwZWNpZXMgPSAibW11c2N1bHVzIikKYWxsX2dwCmFsbF9ncFtbImQxM192c19kMTBfdXAiXV0KYWxsX2dwW1siZDEzX3ZzX2QxMF9kb3duIl1dCgphbGxfZ3BbWyJkMTVfdnNfZDEwX3VwIl1dCmFsbF9ncFtbImQxNV92c19kMTBfZG93biJdXQoKYWxsX2dwW1siZDE1X3ZzX2QxM191cCJdXQphbGxfZ3BbWyJkMTVfdnNfZDEzX2Rvd24iXV0KCiMjIGFsbF9jcCA8LSBhbGxfY2x1c3RlcnByb2ZpbGVyKHNpZywgc3BlY2llcyA9ICJtbXVzY3VsdXMiKQpgYGAK

Examining an experiment in mouse embryogenesis.

atb abelew@gmail.com

2024-02-06