1 Introduction

I am coming into this project in a state of perfect ignorance. Carrie kindly sent me a few or two yesterday but I have yet to open the email and start reading them.

The only things I know for certain:

There are ~ 24 samples with names prefixed with ‘A’ ‘B’ and ‘C’, corresponding to three time point collections at 10.5, 13.5, and 15.5 days. I am going to call these d10,d13,d15.
The most likely reference is the ensembl house mouse mm39; though the real reference is actually the charles river CD-1. I was reasonably certain yesterday that it is possible to download this mouse line’s reference, but I think that is untrue – or at least my attempts to find it failed. At this time I am not certain which samples are which mouse line.
The sequence libraries are likely in the reverse orientation. At least that was my assumption.

The document ‘preprocess.Rmd’ outlines the commands I ran. I used my pipeline’s Process_RNASeq function, which trims, runs fastqc, kraken, hisat, and htseq by default.

2 Metadata

I received a complete sample sheet from either Najib or Carrie and modified it slightly to match the places where I put the raw data. I then copied it to ‘sample_sheets/all_samples.xlsx’ so that I need not worry about messing up the original.

My function ‘gather_preprocessing_metadata()’ has defaults which should provide some helpful new columns in this metadata sheet. Upon completion, it should write a new copy of the same file with a suffix ’_modified.xlsx’.

FIXME: modify the function to detect columns with dates and make sure to keep the encoding the same. FIXED! FIXME: Najib changed his template and added a new first row, add a check against that - or just delete the row manually. FIXED! FIXME: Set the default significant digits back to NULL, having all these darn .000’s is annoying. FIXED!

modified <- gather_preprocessing_metadata("sample_sheets/all_samples.xlsx")

## Did not find the condition column in the sample sheet.

## Filling it in as undefined.

## Did not find the batch column in the sample sheet.

## Filling it in as undefined.

## Skipping for now

## Writing new metadata to: sample_sheets/all_samples_modified.xlsx

## Deleting the file sample_sheets/all_samples_modified.xlsx before writing the tables.

I immediately learned that I somehow forgot to process the first sample!? It is processing now, I have no clue how that happened.

3 Annotations

load_biomart_annotations, if not told anything else, will connect to ensembl and attempt to download the most commonly requested annotations for homo_sapiens from the archive server 2 years before the current date. This is because, as a general rule, I use genomes which are ~ 2-3 years old.

I am also downloading the ontology data, though most tools are aware of Mus.

In addition, I will load the gff annotations from the gff file used to count the genes, just in case there are some mismatches between the ensembl and gff gene IDs.

annot <- load_biomart_annotations(species = "mmusculus", year = 2022, month = 7)

## The biomart annotations file already exists, loading from it.

gene_annotations <- annot[["gene_annotations"]]

go_db <- load_biomart_go(species = "mmusculus", year = 2022, month = 7)

## The biomart annotations file already exists, loading from it.

gff_annot <- load_gff_annotations("~/libraries/genome/mm38_100.gff", id_col = "gene_id")

## Returning a df with 32 columns and 3899382 rows.

4 Initial expressionset

The experimental metadata now includes the count table filenames and I have a reasonable set of gene annotations. I should be able therefore the merge them all into an expressionset and/or summarizedExperiment.

mm_expt <- create_expt(modified[["new_file"]],
                       gene_info = gene_annotations,
                       annotation = "org.Mm.eg.db",
                       file_column = "hisatcounttable") %>%
  set_expt_conditions(fact = "time") %>%
  set_expt_batches(fact = "datecategorical")

## Reading the sample metadata.

## The sample definitions comprises: 17 rows(samples) and 42 columns(metadata fields).

## Matched 25760 annotations and counts.

## Bringing together the count matrix and gene information.

## Saving the expressionset to 'expt.rda'.

## The final expressionset has 25760 features and 17 samples.

## The numbers of samples by condition are:

## 
## d10 d13 d15 
##   5   6   6

## The number of samples by batch are:

## 
## b1 b2 b3 b4 
## 11  2  2  2

written <- write_expt(expt, excel = glue("excel/all_samples-v{ver}.xlsx"))

## Error in (function (classes, fdef, mtable) : unable to find an inherited method for function 'exprs' for signature '"function"'

5 Poke at it

plot_libsize(mm_expt)

## Library sizes of 17 samples, 
## ranging from 27,324,171 to 69,203,380.

plot_nonzero(mm_expt)

## The following samples have less than 16744 genes.

## [1] "A1" "A2" "A5" "B1" "B3" "B4"

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.

## Scale for fill is already present.
## Adding another scale for fill, which will replace the existing scale.
## A non-zero genes plot of 17 samples.
## These samples have an average 37.06 CPM coverage and 16818 genes observed, ranging from 16399 to
## 17275.

norm <- normalize_expt(mm_expt, transform = "log2", convert = "cpm",
                       norm = "quant", filter = TRUE)

## Removing 12303 low-count genes (13457 remaining).
## transform_counts: Found 57 values equal to 0, adding 1 to the matrix.

plot_corheat(norm)

## A heatmap of pairwise sample correlations ranging from: 
## 0.745893022508784 to 0.996487658158264.

plot_disheat(norm)

## A heatmap of pairwise sample distances ranging from: 
## 19.647203152876 to 167.113181354411.

plot_pca(norm)

## The result of performing a fast_svd dimension reduction.
## The x-axis is PC1 and the y-axis is PC2
## Colors are defined by d10, d13, d15
## Shapes are defined by b1, b2, b3, b4.

Holy ass crackers! I am not sure I have ever had a dataset which split this coherently. I need better names than ‘A’ ‘B’ ‘C’.

Ok, I will just do a no-batch DE because I am not sure of the actual batches and/or surrogates, and who cares the data split so well I am worried (not really) it is simulated.

Oh, before I forget, April has been asking about rRNA content. I think I quantified that?

5.1 Check the rRNA content

No, it appears I didn’t submit rRNA queries. Lets do that now before I forget.

cd preprocessing
start=$(pwd)
for i in A* B* C*; do
    cd $i
    cyoa --method hisat --species mm38_100 --libtype rRNA --gff_type misc_feature --gff_tag ID \
         --input $(/bin/ls *-trimmed.fastq.xz | tr '\n' ':' | sed 's/:$//g')
    cd $start
done

I checked the logs for a few samples and it looks like the rRNA content is less than 1% in most(all?) of the samples.

6 varpart

varpart <- simple_varpart(mm_expt)

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in cov2cor(as.matrix(V)): diag(.) had 0 or NA entries; non-finite result is doubtful

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in cov2cor(as.matrix(V)): diag(.) had 0 or NA entries; non-finite result is doubtful

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in cov2cor(as.matrix(V)): diag(.) had 0 or NA entries; non-finite result is doubtful

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in cov2cor(as.matrix(V)): diag(.) had 0 or NA entries; non-finite result is doubtful

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in cov2cor(as.matrix(V)): diag(.) had 0 or NA entries; non-finite result is doubtful

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Error in { : task 7884 failed - "missing value where TRUE/FALSE needed"

## Retrying with only condition in the model.

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## Warning in summary.lm(object, ...): essentially perfect fit: summary may be unreliable

## 
## Total:139 s

varpart

## The result of using variancePartition with the model:
## ~ condition + batch

7 GSVA

Since I have not read the kindly-sent reviews, I will cheat a little and use GSVA to get some ideas about potential papers. I default to C2 which is likely not the right gene set list.

I just downloaded the new msigdb, let us use that instead of the much less interesting GSVAdata set. Frustratingly, the new version of MSigDB provides invalid XML (there are apparently ‘<’ characters in the text fields of this file, which is explicitly forbidden in the XML standard), so I wrote a function to read the annotations from the SQLite database.

FIXME: I need to do some work to clean up the IDs with this new function.

mm_gsva <- simple_gsva(mm_expt, orgdb = "org.Mm.eg.db", signature_category = "c2",
                       msig_db =  "reference/msigdb_v2023.2.Mm/msigdb_v2023.2.Mm.db",
                       signatures = "reference/msigdb_v2023.2.Mm/m2.all.v2023.2.Mm.entrez.gmt")

## Converting the rownames() of the expressionset to ENTREZID.

## 4032 ENSEMBL ID's didn't have a matching ENTEREZ ID. Dropping them now.

## Before conversion, the expressionset has 25760 entries.

## Subsetting on genes.

## remove_genes_expt(), before removal, there were 25760 genes, now there are 21669.

## Error in h(simpleError(msg, call)): error in evaluating the argument 'object' in selecting a method for function 'exprs': object 'converted_eset' not found

mm_gsva

## Error in eval(expr, envir, enclos): object 'mm_gsva' not found

mm_gsva_sig <- get_sig_gsva_categories(mm_gsva)

## Error in eval(expr, envir, enclos): object 'mm_gsva' not found

mm_gsva_sig

## Error in eval(expr, envir, enclos): object 'mm_gsva_sig' not found

mm_gsva_sig$score_pca

## Error in eval(expr, envir, enclos): object 'mm_gsva_sig' not found

8 Kraken matrix

Come back to this, note to self the previous iteration was explicitly looking for Pseudomonas contamination.

genus_expt <- create_expt(gathered[["new_file"]],
                          file_column = "krakenmatrix", file_type = "table")
genus_norm <- normalize_expt(genus_expt, convert = "cpm")
plot_disheat(genus_norm)
genus_normv2 <- normalize_expt(genus_expt, convert = "cpm", transform = "log2")
plot_pca(genus_normv2)
plot_libsize(genus_expt)
head(exprs(genus_expt))
exprs(genus_expt)["Pseudomonas", ]

9 Differential Expression

Until I get more meaningful condition names, I will just do B/A C/A C/B

keepers <- list(
  "d13_vs_d10" = c("d13", "d10"),
  "d15_vs_d10" = c("d15", "d10"),
  "d15_vs_d13" = c("d15", "d13"))
de <- all_pairwise(mm_expt, filter = TRUE, model_batch = FALSE)

## 
## d10 d13 d15 
##   5   6   6

tables <- combine_de_tables(
  de, keepers = keepers, excel = glue("excel/de_tables-v{ver}.xlsx"))

## Deleting the file excel/de_tables-v20240205.xlsx before writing the tables.

sig <- extract_significant_genes(
  tables, according_to = "deseq", excel = glue("excel/de_sig-v{ver}.xlsx"))

## Deleting the file excel/de_sig-v20240205.xlsx before writing the tables.

10 Ontology enrichment

mm38 is nicely supported in gProfiler/clusterProfiler.

all_gp <- all_gprofiler(sig, species = "mmusculus")
all_gp

## Running gProfiler on every set of significant genes found:

##                   GO KEGG REAC WP  TF MIRNA HPA CORUM HP
## d13_vs_d10_up   1329    4   14  2 483     0   0     0  0
## d13_vs_d10_down 1296    9   58  1 407     0   0     0  0
## d15_vs_d10_up   1484    5    9  0 524     0   0     0  0
## d15_vs_d10_down 1374   11   80  2 489     0   0     0  0
## d15_vs_d13_up    656    3    3  0 146     0   0     0  1
## d15_vs_d13_down  168    0    0  0  36     0   0     0  0

all_gp[["d13_vs_d10_up"]]

## A set of ontologies produced by gprofiler using 2437
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1329 GO hits, 4, KEGG hits, 14 reactome hits, 2 wikipathway hits, 483 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.

## Category MF is the most populated with 30 hits.

all_gp[["d13_vs_d10_down"]]

## A set of ontologies produced by gprofiler using 1497
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1296 GO hits, 9, KEGG hits, 58 reactome hits, 1 wikipathway hits, 407 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d10_up"]]

## A set of ontologies produced by gprofiler using 2916
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1484 GO hits, 5, KEGG hits, 9 reactome hits, 0 wikipathway hits, 524 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d10_down"]]

## A set of ontologies produced by gprofiler using 1840
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 1374 GO hits, 11, KEGG hits, 80 reactome hits, 2 wikipathway hits, 489 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d13_up"]]

## A set of ontologies produced by gprofiler using 753
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 656 GO hits, 3, KEGG hits, 3 reactome hits, 0 wikipathway hits, 146 transcription factor hits, 0 miRNA hits, 0 HPA hits, 1 HP hits, and 0 CORUM hits.
## Category MF is the most populated with 30 hits.

all_gp[["d15_vs_d13_down"]]

## A set of ontologies produced by gprofiler using 199
## genes against the mmusculus annotations and significance cutoff 0.05.
## There are 168 GO hits, 0, KEGG hits, 0 reactome hits, 0 wikipathway hits, 36 transcription factor hits, 0 miRNA hits, 0 HPA hits, 0 HP hits, and 0 CORUM hits.

## Category BP is the most populated with 30 hits.

## all_cp <- all_clusterprofiler(sig, species = "mmusculus")

LS0tCnRpdGxlOiAiRXhhbWluaW5nIGFuIGV4cGVyaW1lbnQgaW4gbW91c2UgZW1icnlvZ2VuZXNpcy4iCmF1dGhvcjogImF0YiBhYmVsZXdAZ21haWwuY29tIgpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICAgY29kZV9kb3dubG9hZDogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93CiAgICBmaWdfY2FwdGlvbjogdHJ1ZQogICAgZmlnX2hlaWdodDogNwogICAgZmlnX3dpZHRoOiA3CiAgICBoaWdobGlnaHQ6IHplbmJ1cm4KICAgIGtlZXBfbWQ6IGZhbHNlCiAgICBtb2RlOiBzZWxmY29udGFpbmVkCiAgICBudW1iZXJfc2VjdGlvbnM6IHRydWUKICAgIHNlbGZfY29udGFpbmVkOiB0cnVlCiAgICB0aGVtZTogcmVhZGFibGUKICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OgogICAgICBjb2xsYXBzZWQ6IGZhbHNlCiAgICAgIHNtb290aF9zY3JvbGw6IGZhbHNlCiAgcm1kZm9ybWF0czo6cmVhZHRoZWRvd246CiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCiAgICBjb2RlX2ZvbGRpbmc6IHNob3cKICAgIGRmX3ByaW50OiBwYWdlZAogICAgZmlnX2NhcHRpb246IHRydWUKICAgIGZpZ19oZWlnaHQ6IDcKICAgIGZpZ193aWR0aDogNwogICAgaGlnaGxpZ2h0OiB6ZW5idXJuCiAgICB3aWR0aDogMzAwCiAgICBrZWVwX21kOiBmYWxzZQogICAgbW9kZTogc2VsZmNvbnRhaW5lZAogICAgdG9jX2Zsb2F0OiB0cnVlCiAgQmlvY1N0eWxlOjpodG1sX2RvY3VtZW50OgogICAgY29kZV9kb3dubG9hZDogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93CiAgICBmaWdfY2FwdGlvbjogdHJ1ZQogICAgZmlnX2hlaWdodDogNwogICAgZmlnX3dpZHRoOiA3CiAgICBoaWdobGlnaHQ6IHplbmJ1cm4KICAgIGtlZXBfbWQ6IGZhbHNlCiAgICBtb2RlOiBzZWxmY29udGFpbmVkCiAgICB0b2NfZmxvYXQ6IHRydWUKLS0tCgo8c3R5bGUgdHlwZT0idGV4dC9jc3MiPgpib2R5LCB0ZCB7CiAgZm9udC1zaXplOiAxNnB4Owp9CmNvZGUucnsKICBmb250LXNpemU6IDE2cHg7Cn0KcHJlIHsKIGZvbnQtc2l6ZTogMTZweAp9CmJvZHkgLm1haW4tY29udGFpbmVyIHsKICBtYXgtd2lkdGg6IDE2MDBweDsKfQo8L3N0eWxlPgoKYGBge3Igb3B0aW9ucywgaW5jbHVkZT1GQUxTRX0KbGlicmFyeShocGdsdG9vbHMpCmxpYnJhcnkoaHBnbGRhdGEpCmxpYnJhcnkocmV0aWN1bGF0ZSkKbGlicmFyeShnbHVlKQp0dCA8LSBkZXZ0b29sczo6bG9hZF9hbGwoIn4vaHBnbHRvb2xzIikKa25pdHI6Om9wdHNfa25pdCRzZXQoCiAgcHJvZ3Jlc3MgPSBUUlVFLCB2ZXJib3NlID0gVFJVRSwgd2lkdGggPSA5MCwgZWNobyA9IFRSVUUpCmtuaXRyOjpvcHRzX2NodW5rJHNldCgKICBlcnJvciA9IFRSVUUsIGZpZy53aWR0aCA9IDgsIGZpZy5oZWlnaHQgPSA4LCBmaWcucmV0aW5hID0gMiwKICBmaWcucG9zID0gInQiLCBmaWcuYWxpZ24gPSAiY2VudGVyIiwgZHBpID0gaWYgKGtuaXRyOjppc19sYXRleF9vdXRwdXQoKSkgNzIgZWxzZSAzMDAsCiAgb3V0LndpZHRoID0gIjEwMCUiLCBkZXYgPSAicG5nIiwKICBkZXYuYXJncyA9IGxpc3QocG5nID0gbGlzdCh0eXBlID0gImNhaXJvLXBuZyIpKSkKb2xkX29wdGlvbnMgPC0gb3B0aW9ucyhkaWdpdHMgPSA0LAogICAgICAgICAgICAgICAgICAgICAgIHN0cmluZ3NBc0ZhY3RvcnMgPSBGQUxTRSwKICAgICAgICAgICAgICAgICAgICAgICBrbml0ci5kdXBsaWNhdGUubGFiZWwgPSAiYWxsb3ciKQpnZ3Bsb3QyOjp0aGVtZV9zZXQoZ2dwbG90Mjo6dGhlbWVfYncoYmFzZV9zaXplID0gMTIpKQp2ZXIgPC0gIjIwMjQwMSIKcHJldmlvdXNfZmlsZSA8LSAiIgp2ZXIgPC0gZm9ybWF0KFN5cy5EYXRlKCksICIlWSVtJWQiKQoKIyN0bXAgPC0gc20obG9hZG1lKGZpbGVuYW1lPXBhc3RlMChnc3ViKHBhdHRlcm49IlxcLlJtZCIsIHJlcGxhY2U9IiIsIHg9cHJldmlvdXNfZmlsZSksICItdiIsIHZlciwgIi5yZGEueHoiKSkpCnJtZF9maWxlIDwtICJpbmRleC5SbWQiCmBgYAoKIyBJbnRyb2R1Y3Rpb24KCkkgYW0gY29taW5nIGludG8gdGhpcyBwcm9qZWN0IGluIGEgc3RhdGUgb2YgcGVyZmVjdCBpZ25vcmFuY2UuICBDYXJyaWUKa2luZGx5IHNlbnQgbWUgYSBmZXcgb3IgdHdvIHllc3RlcmRheSBidXQgSSBoYXZlIHlldCB0byBvcGVuIHRoZSBlbWFpbAphbmQgc3RhcnQgcmVhZGluZyB0aGVtLgoKVGhlIG9ubHkgdGhpbmdzIEkga25vdyBmb3IgY2VydGFpbjoKCjEuICBUaGVyZSBhcmUgfiAyNCBzYW1wbGVzIHdpdGggbmFtZXMgcHJlZml4ZWQgd2l0aCAnQScgJ0InIGFuZCAnQycsCiAgICBjb3JyZXNwb25kaW5nIHRvIHRocmVlIHRpbWUgcG9pbnQgY29sbGVjdGlvbnMgYXQgMTAuNSwgMTMuNSwgYW5kCiAgICAxNS41IGRheXMuICBJIGFtIGdvaW5nIHRvIGNhbGwgdGhlc2UgZDEwLGQxMyxkMTUuCjIuICBUaGUgbW9zdCBsaWtlbHkgcmVmZXJlbmNlIGlzIHRoZSBlbnNlbWJsIGhvdXNlIG1vdXNlIG1tMzk7IHRob3VnaAogICAgdGhlIHJlYWwgcmVmZXJlbmNlIGlzIGFjdHVhbGx5IHRoZSBjaGFybGVzIHJpdmVyIENELTEuICBJIHdhcwogICAgcmVhc29uYWJseSBjZXJ0YWluIHllc3RlcmRheSB0aGF0IGl0IGlzIHBvc3NpYmxlIHRvIGRvd25sb2FkIHRoaXMKICAgIG1vdXNlIGxpbmUncyByZWZlcmVuY2UsIGJ1dCBJIHRoaW5rIHRoYXQgaXMgdW50cnVlIC0tIG9yIGF0IGxlYXN0CiAgICBteSBhdHRlbXB0cyB0byBmaW5kIGl0IGZhaWxlZC4gIEF0IHRoaXMgdGltZSBJIGFtIG5vdCBjZXJ0YWluCiAgICB3aGljaCBzYW1wbGVzIGFyZSB3aGljaCBtb3VzZSBsaW5lLgozLiAgVGhlIHNlcXVlbmNlIGxpYnJhcmllcyBhcmUgbGlrZWx5IGluIHRoZSByZXZlcnNlIG9yaWVudGF0aW9uLiAgQXQKICAgIGxlYXN0IHRoYXQgd2FzIG15IGFzc3VtcHRpb24uCgpUaGUgZG9jdW1lbnQgJ3ByZXByb2Nlc3MuUm1kJyBvdXRsaW5lcyB0aGUgY29tbWFuZHMgSSByYW4uICBJIHVzZWQgbXkKcGlwZWxpbmUncyBQcm9jZXNzX1JOQVNlcSBmdW5jdGlvbiwgd2hpY2ggdHJpbXMsIHJ1bnMgZmFzdHFjLCBrcmFrZW4sCmhpc2F0LCBhbmQgaHRzZXEgYnkgZGVmYXVsdC4KCiMgTWV0YWRhdGEKCkkgcmVjZWl2ZWQgYSBjb21wbGV0ZSBzYW1wbGUgc2hlZXQgZnJvbSBlaXRoZXIgTmFqaWIgb3IgQ2FycmllIGFuZAptb2RpZmllZCBpdCBzbGlnaHRseSB0byBtYXRjaCB0aGUgcGxhY2VzIHdoZXJlIEkgcHV0IHRoZSByYXcgZGF0YS4gIEkKdGhlbiBjb3BpZWQgaXQgdG8gJ3NhbXBsZV9zaGVldHMvYWxsX3NhbXBsZXMueGxzeCcgc28gdGhhdCBJIG5lZWQgbm90CndvcnJ5IGFib3V0IG1lc3NpbmcgdXAgdGhlIG9yaWdpbmFsLgoKTXkgZnVuY3Rpb24gJ2dhdGhlcl9wcmVwcm9jZXNzaW5nX21ldGFkYXRhKCknIGhhcyBkZWZhdWx0cyB3aGljaApzaG91bGQgcHJvdmlkZSBzb21lIGhlbHBmdWwgbmV3IGNvbHVtbnMgaW4gdGhpcyBtZXRhZGF0YSBzaGVldC4gIFVwb24KY29tcGxldGlvbiwgaXQgc2hvdWxkIHdyaXRlIGEgbmV3IGNvcHkgb2YgdGhlIHNhbWUgZmlsZSB3aXRoIGEgc3VmZml4CidfbW9kaWZpZWQueGxzeCcuCgpGSVhNRTogbW9kaWZ5IHRoZSBmdW5jdGlvbiB0byBkZXRlY3QgY29sdW1ucyB3aXRoIGRhdGVzIGFuZCBtYWtlIHN1cmUKdG8ga2VlcCB0aGUgZW5jb2RpbmcgdGhlIHNhbWUuIEZJWEVEIQpGSVhNRTogTmFqaWIgY2hhbmdlZCBoaXMgdGVtcGxhdGUgYW5kIGFkZGVkIGEgbmV3IGZpcnN0IHJvdywgYWRkIGEKY2hlY2sgYWdhaW5zdCB0aGF0IC0gb3IganVzdCBkZWxldGUgdGhlIHJvdyBtYW51YWxseS4gRklYRUQhCkZJWE1FOiBTZXQgdGhlIGRlZmF1bHQgc2lnbmlmaWNhbnQgZGlnaXRzIGJhY2sgdG8gTlVMTCwgaGF2aW5nIGFsbAp0aGVzZSBkYXJuIC4wMDAncyBpcyBhbm5veWluZy4gRklYRUQhCgpgYGB7cn0KbW9kaWZpZWQgPC0gZ2F0aGVyX3ByZXByb2Nlc3NpbmdfbWV0YWRhdGEoInNhbXBsZV9zaGVldHMvYWxsX3NhbXBsZXMueGxzeCIpCmBgYAoKSSBpbW1lZGlhdGVseSBsZWFybmVkIHRoYXQgSSBzb21laG93IGZvcmdvdCB0byBwcm9jZXNzIHRoZSBmaXJzdApzYW1wbGUhPyBJdCBpcyBwcm9jZXNzaW5nIG5vdywgSSBoYXZlIG5vIGNsdWUgaG93IHRoYXQgaGFwcGVuZWQuCgojIEFubm90YXRpb25zCgpsb2FkX2Jpb21hcnRfYW5ub3RhdGlvbnMsIGlmIG5vdCB0b2xkIGFueXRoaW5nIGVsc2UsIHdpbGwgY29ubmVjdCB0bwplbnNlbWJsIGFuZCBhdHRlbXB0IHRvIGRvd25sb2FkIHRoZSBtb3N0IGNvbW1vbmx5IHJlcXVlc3RlZAphbm5vdGF0aW9ucyBmb3IgaG9tb19zYXBpZW5zIGZyb20gdGhlIGFyY2hpdmUgc2VydmVyIDIgeWVhcnMgYmVmb3JlCnRoZSBjdXJyZW50IGRhdGUuICBUaGlzIGlzIGJlY2F1c2UsIGFzIGEgZ2VuZXJhbCBydWxlLCBJIHVzZSBnZW5vbWVzCndoaWNoIGFyZSB+IDItMyB5ZWFycyBvbGQuCgpJIGFtIGFsc28gZG93bmxvYWRpbmcgdGhlIG9udG9sb2d5IGRhdGEsIHRob3VnaCBtb3N0IHRvb2xzIGFyZSBhd2FyZQpvZiBNdXMuCgpJbiBhZGRpdGlvbiwgSSB3aWxsIGxvYWQgdGhlIGdmZiBhbm5vdGF0aW9ucyBmcm9tIHRoZSBnZmYgZmlsZSB1c2VkIHRvCmNvdW50IHRoZSBnZW5lcywganVzdCBpbiBjYXNlIHRoZXJlIGFyZSBzb21lIG1pc21hdGNoZXMgYmV0d2VlbiB0aGUKZW5zZW1ibCBhbmQgZ2ZmIGdlbmUgSURzLgoKYGBge3J9CmFubm90IDwtIGxvYWRfYmlvbWFydF9hbm5vdGF0aW9ucyhzcGVjaWVzID0gIm1tdXNjdWx1cyIsIHllYXIgPSAyMDIyLCBtb250aCA9IDcpCmdlbmVfYW5ub3RhdGlvbnMgPC0gYW5ub3RbWyJnZW5lX2Fubm90YXRpb25zIl1dCgpnb19kYiA8LSBsb2FkX2Jpb21hcnRfZ28oc3BlY2llcyA9ICJtbXVzY3VsdXMiLCB5ZWFyID0gMjAyMiwgbW9udGggPSA3KQoKZ2ZmX2Fubm90IDwtIGxvYWRfZ2ZmX2Fubm90YXRpb25zKCJ+L2xpYnJhcmllcy9nZW5vbWUvbW0zOF8xMDAuZ2ZmIiwgaWRfY29sID0gImdlbmVfaWQiKQpgYGAKCiMgSW5pdGlhbCBleHByZXNzaW9uc2V0CgpUaGUgZXhwZXJpbWVudGFsIG1ldGFkYXRhIG5vdyBpbmNsdWRlcyB0aGUgY291bnQgdGFibGUgZmlsZW5hbWVzIGFuZCBJCmhhdmUgYSByZWFzb25hYmxlIHNldCBvZiBnZW5lIGFubm90YXRpb25zLiAgSSBzaG91bGQgYmUgYWJsZSB0aGVyZWZvcmUKdGhlIG1lcmdlIHRoZW0gYWxsIGludG8gYW4gZXhwcmVzc2lvbnNldCBhbmQvb3Igc3VtbWFyaXplZEV4cGVyaW1lbnQuCgpgYGB7cn0KbW1fZXhwdCA8LSBjcmVhdGVfZXhwdChtb2RpZmllZFtbIm5ld19maWxlIl1dLAogICAgICAgICAgICAgICAgICAgICAgIGdlbmVfaW5mbyA9IGdlbmVfYW5ub3RhdGlvbnMsCiAgICAgICAgICAgICAgICAgICAgICAgYW5ub3RhdGlvbiA9ICJvcmcuTW0uZWcuZGIiLAogICAgICAgICAgICAgICAgICAgICAgIGZpbGVfY29sdW1uID0gImhpc2F0Y291bnR0YWJsZSIpICU+JQogIHNldF9leHB0X2NvbmRpdGlvbnMoZmFjdCA9ICJ0aW1lIikgJT4lCiAgc2V0X2V4cHRfYmF0Y2hlcyhmYWN0ID0gImRhdGVjYXRlZ29yaWNhbCIpCgoKd3JpdHRlbiA8LSB3cml0ZV9leHB0KGV4cHQsIGV4Y2VsID0gZ2x1ZSgiZXhjZWwvYWxsX3NhbXBsZXMtdnt2ZXJ9Lnhsc3giKSkKYGBgCgojIFBva2UgYXQgaXQKCmBgYHtyfQpwbG90X2xpYnNpemUobW1fZXhwdCkKcGxvdF9ub256ZXJvKG1tX2V4cHQpCgpub3JtIDwtIG5vcm1hbGl6ZV9leHB0KG1tX2V4cHQsIHRyYW5zZm9ybSA9ICJsb2cyIiwgY29udmVydCA9ICJjcG0iLAogICAgICAgICAgICAgICAgICAgICAgIG5vcm0gPSAicXVhbnQiLCBmaWx0ZXIgPSBUUlVFKQpwbG90X2NvcmhlYXQobm9ybSkKcGxvdF9kaXNoZWF0KG5vcm0pCnBsb3RfcGNhKG5vcm0pCmBgYAoKSG9seSBhc3MgY3JhY2tlcnMhICBJIGFtIG5vdCBzdXJlIEkgaGF2ZSBldmVyIGhhZCBhIGRhdGFzZXQgd2hpY2gKc3BsaXQgdGhpcyBjb2hlcmVudGx5LiAgSSBuZWVkIGJldHRlciBuYW1lcyB0aGFuICdBJyAnQicgJ0MnLgoKT2ssIEkgd2lsbCBqdXN0IGRvIGEgbm8tYmF0Y2ggREUgYmVjYXVzZSBJIGFtIG5vdCBzdXJlIG9mIHRoZSBhY3R1YWwKYmF0Y2hlcyBhbmQvb3Igc3Vycm9nYXRlcywgYW5kIHdobyBjYXJlcyB0aGUgZGF0YSBzcGxpdCBzbyB3ZWxsIEkgYW0Kd29ycmllZCAobm90IHJlYWxseSkgaXQgaXMgc2ltdWxhdGVkLgoKT2gsIGJlZm9yZSBJIGZvcmdldCwgQXByaWwgaGFzIGJlZW4gYXNraW5nIGFib3V0IHJSTkEgY29udGVudC4gIEkKdGhpbmsgSSBxdWFudGlmaWVkIHRoYXQ/CgojIyBDaGVjayB0aGUgclJOQSBjb250ZW50CgpObywgaXQgYXBwZWFycyBJIGRpZG4ndCBzdWJtaXQgclJOQSBxdWVyaWVzLiAgTGV0cyBkbyB0aGF0IG5vdyBiZWZvcmUKSSBmb3JnZXQuCgpgYGB7YmFzaCwgZXZhbD1GQUxTRX0KY2QgcHJlcHJvY2Vzc2luZwpzdGFydD0kKHB3ZCkKZm9yIGkgaW4gQSogQiogQyo7IGRvCiAgICBjZCAkaQogICAgY3lvYSAtLW1ldGhvZCBoaXNhdCAtLXNwZWNpZXMgbW0zOF8xMDAgLS1saWJ0eXBlIHJSTkEgLS1nZmZfdHlwZSBtaXNjX2ZlYXR1cmUgLS1nZmZfdGFnIElEIFwKICAgICAgICAgLS1pbnB1dCAkKC9iaW4vbHMgKi10cmltbWVkLmZhc3RxLnh6IHwgdHIgJ1xuJyAnOicgfCBzZWQgJ3MvOiQvL2cnKQogICAgY2QgJHN0YXJ0CmRvbmUKYGBgCgpJIGNoZWNrZWQgdGhlIGxvZ3MgZm9yIGEgZmV3IHNhbXBsZXMgYW5kIGl0IGxvb2tzIGxpa2UgdGhlIHJSTkEKY29udGVudCBpcyBsZXNzIHRoYW4gMSUgaW4gbW9zdChhbGw/KSBvZiB0aGUgc2FtcGxlcy4KCiMgdmFycGFydAoKYGBge3J9CnZhcnBhcnQgPC0gc2ltcGxlX3ZhcnBhcnQobW1fZXhwdCkKdmFycGFydApgYGAKCiMgR1NWQQoKU2luY2UgSSBoYXZlIG5vdCByZWFkIHRoZSBraW5kbHktc2VudCByZXZpZXdzLCBJIHdpbGwgY2hlYXQgYSBsaXR0bGUKYW5kIHVzZSBHU1ZBIHRvIGdldCBzb21lIGlkZWFzIGFib3V0IHBvdGVudGlhbCBwYXBlcnMuICBJIGRlZmF1bHQgdG8KQzIgd2hpY2ggaXMgbGlrZWx5IG5vdCB0aGUgcmlnaHQgZ2VuZSBzZXQgbGlzdC4KCkkganVzdCBkb3dubG9hZGVkIHRoZSBuZXcgbXNpZ2RiLCBsZXQgdXMgdXNlIHRoYXQgaW5zdGVhZCBvZiB0aGUgbXVjaApsZXNzIGludGVyZXN0aW5nIEdTVkFkYXRhIHNldC4gIEZydXN0cmF0aW5nbHksIHRoZSBuZXcgdmVyc2lvbiBvZgpNU2lnREIgcHJvdmlkZXMgaW52YWxpZCBYTUwgKHRoZXJlIGFyZSBhcHBhcmVudGx5ICc8JyBjaGFyYWN0ZXJzIGluCnRoZSB0ZXh0IGZpZWxkcyBvZiB0aGlzIGZpbGUsIHdoaWNoIGlzIGV4cGxpY2l0bHkgZm9yYmlkZGVuIGluIHRoZSBYTUwKc3RhbmRhcmQpLCBzbyBJIHdyb3RlIGEgZnVuY3Rpb24gdG8gcmVhZCB0aGUgYW5ub3RhdGlvbnMgZnJvbSB0aGUKU1FMaXRlIGRhdGFiYXNlLgoKRklYTUU6IEkgbmVlZCB0byBkbyBzb21lIHdvcmsgdG8gY2xlYW4gdXAgdGhlIElEcyB3aXRoIHRoaXMgbmV3CmZ1bmN0aW9uLgoKYGBge3J9Cm1tX2dzdmEgPC0gc2ltcGxlX2dzdmEobW1fZXhwdCwgb3JnZGIgPSAib3JnLk1tLmVnLmRiIiwgc2lnbmF0dXJlX2NhdGVnb3J5ID0gImMyIiwKICAgICAgICAgICAgICAgICAgICAgICBtc2lnX2RiID0gICJyZWZlcmVuY2UvbXNpZ2RiX3YyMDIzLjIuTW0vbXNpZ2RiX3YyMDIzLjIuTW0uZGIiLAogICAgICAgICAgICAgICAgICAgICAgIHNpZ25hdHVyZXMgPSAicmVmZXJlbmNlL21zaWdkYl92MjAyMy4yLk1tL20yLmFsbC52MjAyMy4yLk1tLmVudHJlei5nbXQiKQptbV9nc3ZhCgptbV9nc3ZhX3NpZyA8LSBnZXRfc2lnX2dzdmFfY2F0ZWdvcmllcyhtbV9nc3ZhKQptbV9nc3ZhX3NpZwptbV9nc3ZhX3NpZyRzY29yZV9wY2EKYGBgCgojIEtyYWtlbiBtYXRyaXgKCkNvbWUgYmFjayB0byB0aGlzLCBub3RlIHRvIHNlbGYgdGhlIHByZXZpb3VzIGl0ZXJhdGlvbiB3YXMgZXhwbGljaXRseQpsb29raW5nIGZvciBQc2V1ZG9tb25hcyBjb250YW1pbmF0aW9uLgoKYGBge3IsIGV2YWw9RkFMU0V9CmdlbnVzX2V4cHQgPC0gY3JlYXRlX2V4cHQoZ2F0aGVyZWRbWyJuZXdfZmlsZSJdXSwKICAgICAgICAgICAgICAgICAgICAgICAgICBmaWxlX2NvbHVtbiA9ICJrcmFrZW5tYXRyaXgiLCBmaWxlX3R5cGUgPSAidGFibGUiKQpnZW51c19ub3JtIDwtIG5vcm1hbGl6ZV9leHB0KGdlbnVzX2V4cHQsIGNvbnZlcnQgPSAiY3BtIikKcGxvdF9kaXNoZWF0KGdlbnVzX25vcm0pCmdlbnVzX25vcm12MiA8LSBub3JtYWxpemVfZXhwdChnZW51c19leHB0LCBjb252ZXJ0ID0gImNwbSIsIHRyYW5zZm9ybSA9ICJsb2cyIikKcGxvdF9wY2EoZ2VudXNfbm9ybXYyKQpwbG90X2xpYnNpemUoZ2VudXNfZXhwdCkKaGVhZChleHBycyhnZW51c19leHB0KSkKZXhwcnMoZ2VudXNfZXhwdClbIlBzZXVkb21vbmFzIiwgXQpgYGAKCiMgRGlmZmVyZW50aWFsIEV4cHJlc3Npb24KClVudGlsIEkgZ2V0IG1vcmUgbWVhbmluZ2Z1bCBjb25kaXRpb24gbmFtZXMsIEkgd2lsbCBqdXN0IGRvIEIvQSBDL0EKQy9CCgpgYGB7cn0Ka2VlcGVycyA8LSBsaXN0KAogICJkMTNfdnNfZDEwIiA9IGMoImQxMyIsICJkMTAiKSwKICAiZDE1X3ZzX2QxMCIgPSBjKCJkMTUiLCAiZDEwIiksCiAgImQxNV92c19kMTMiID0gYygiZDE1IiwgImQxMyIpKQpkZSA8LSBhbGxfcGFpcndpc2UobW1fZXhwdCwgZmlsdGVyID0gVFJVRSwgbW9kZWxfYmF0Y2ggPSBGQUxTRSkKdGFibGVzIDwtIGNvbWJpbmVfZGVfdGFibGVzKAogIGRlLCBrZWVwZXJzID0ga2VlcGVycywgZXhjZWwgPSBnbHVlKCJleGNlbC9kZV90YWJsZXMtdnt2ZXJ9Lnhsc3giKSkKc2lnIDwtIGV4dHJhY3Rfc2lnbmlmaWNhbnRfZ2VuZXMoCiAgdGFibGVzLCBhY2NvcmRpbmdfdG8gPSAiZGVzZXEiLCBleGNlbCA9IGdsdWUoImV4Y2VsL2RlX3NpZy12e3Zlcn0ueGxzeCIpKQpgYGAKCiMgT250b2xvZ3kgZW5yaWNobWVudAoKbW0zOCBpcyBuaWNlbHkgc3VwcG9ydGVkIGluIGdQcm9maWxlci9jbHVzdGVyUHJvZmlsZXIuCgpgYGB7cn0KYWxsX2dwIDwtIGFsbF9ncHJvZmlsZXIoc2lnLCBzcGVjaWVzID0gIm1tdXNjdWx1cyIpCmFsbF9ncAphbGxfZ3BbWyJkMTNfdnNfZDEwX3VwIl1dCmFsbF9ncFtbImQxM192c19kMTBfZG93biJdXQoKYWxsX2dwW1siZDE1X3ZzX2QxMF91cCJdXQphbGxfZ3BbWyJkMTVfdnNfZDEwX2Rvd24iXV0KCmFsbF9ncFtbImQxNV92c19kMTNfdXAiXV0KYWxsX2dwW1siZDE1X3ZzX2QxM19kb3duIl1dCgojIyBhbGxfY3AgPC0gYWxsX2NsdXN0ZXJwcm9maWxlcihzaWcsIHNwZWNpZXMgPSAibW11c2N1bHVzIikKYGBgCg==

Examining an experiment in mouse embryogenesis.

atb abelew@gmail.com

2024-02-05