fgvieira/ngsLD

[read_geno] cannot read GZip GENO file

katcatalano opened this issue · 2 comments

I am trying to run ngsLD with the GL output from the following angsd command

angsd -bam /local/home/katrinac/ClownfishGWAS/data/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/bamlist.list -GL 1 -doGeno 16 -doMajorMinor 1 -doMaf 1 -doCounts 1 -doPost 1 -minQ 20 -minMapQ 20 -SNP_pval 1e-6 -minInd 16 -minMAF 0.01  -doHWE 1 -minHWEpval 0.05 -setMaxDepth 115 -doGlf 2 -nThreads 40 -out ~/ClownfishGWAS/data/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/appc_angsd_probs    

Then got the following with ngsLD- I looked through previous issues and saw to use --probs with output from -doGlf 2

/local/home/katrinac/ngsLD/ngsLD --geno /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/appc_angsd_probs.beagle.gz --probs --n_ind 159 --n_threads 40 --n_sites 6295181 --pos /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/appc_angsd_pos.txt --outH /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/ngsld/appc_ngsLD.tsv
==> Input Arguments:
        geno: /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/appc_angsd_probs.beagle.gz
        probs: true
        log_scale: false
        n_ind: 159
        n_sites: 6295181
        pos: /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/appc_angsd_pos.txt (WITHOUT header)
        max_kb_dist (kb): 100
        max_snp_dist: 0
        min_maf: 0.001000
        ignore_miss_data: false
        call_geno: false
        N_thresh: 0.000000
        call_thresh: 0.000000
        rnd_sample: 1.000000
        seed: 1646846196
        extend_out: false
        out: /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/ngsld/appc_ngsLD.tsv (WITH header)
        n_threads: 40
        verbose: 1
        version: 1.1.1 (Mar  4 2022 @ 09:52:10)

==> GZIP input file (not BINARY)
> Reading data from file...
> Header found! Skipping line...

=====
ERROR: [read_geno] cannot read GZip GENO file. Check GENO file and number of sites!
=====   

        : Numerical result out of range

My GL file looks like this

zcat angsd/appc_angsd_probs.beagle.gz | head

marker	allele1	allele2	Ind0	Ind0	Ind0	Ind1	Ind1	Ind1	Ind2	Ind2	Ind2	Ind3	Ind3	Ind3	Ind4	Ind4	Ind4	Ind5	Ind5	Ind5	Ind6	Ind6	Ind6	Ind7	Ind7	Ind7	Ind8	Ind8	Ind8	Ind9	Ind9	Ind9	Ind10	Ind10	Ind10	Ind11	Ind11	Ind11	Ind12	Ind12	Ind12	Ind13	Ind13	Ind13	Ind14	Ind14	Ind14	Ind15	Ind15	Ind15	Ind16	Ind16	Ind16	Ind17	Ind17	Ind17	Ind18	Ind18	Ind18	Ind19	Ind19	Ind19	Ind20	Ind20	Ind20	Ind21	Ind21	Ind21	Ind22	Ind22	Ind22	Ind23	Ind23	Ind23	Ind24	Ind24	Ind24	Ind25	Ind25	Ind25	Ind26	Ind26	Ind26	Ind27	Ind27	Ind27	Ind28	Ind28	Ind28	Ind29	Ind29	Ind29	Ind30	Ind30	Ind30	Ind31	Ind31	Ind31	Ind32	Ind32	Ind32	Ind33	Ind33	Ind33	Ind34	Ind34	Ind34	Ind35	Ind35	Ind35	Ind36	Ind36	Ind36	Ind37	Ind37	Ind37	Ind38	Ind38	Ind38	Ind39	Ind39	Ind39	Ind40	Ind40	Ind40	Ind41	Ind41	Ind41	Ind42	Ind42	Ind42	Ind43	Ind43	Ind43	Ind44	Ind44	Ind44	Ind45	Ind45	Ind45	Ind46	Ind46	Ind46	Ind47	Ind47	Ind47	Ind48	Ind48	Ind48	Ind49	Ind49	Ind49	Ind50	Ind50	Ind50	Ind51	Ind51	Ind51	Ind52	Ind52	Ind52	Ind53	Ind53	Ind53	Ind54	Ind54	Ind54	Ind55	Ind55	Ind55	Ind56	Ind56	Ind56	Ind57	Ind57	Ind57	Ind58	Ind58	Ind58	Ind59	Ind59	Ind59	Ind60	Ind60	Ind60	Ind61	Ind61	Ind61	Ind62	Ind62	Ind62	Ind63	Ind63	Ind63	Ind64	Ind64	Ind64	Ind65	Ind65	Ind65	Ind66	Ind66	Ind66	Ind67	Ind67	Ind67	Ind68	Ind68	Ind68	Ind69	Ind69	Ind69	Ind70	Ind70	Ind70	Ind71	Ind71	Ind71	Ind72	Ind72	Ind72	Ind73	Ind73	Ind73	Ind74	Ind74	Ind74	Ind75	Ind75	Ind75	Ind76	Ind76	Ind76	Ind77	Ind77	Ind77	Ind78	Ind78	Ind78	Ind79	Ind79	Ind79	Ind80	Ind80	Ind80	Ind81	Ind81	Ind81	Ind82	Ind82	Ind82	Ind83	Ind83	Ind83	Ind84	Ind84	Ind84	Ind85	Ind85	Ind85	Ind86	Ind86	Ind86	Ind87	Ind87	Ind87	Ind88	Ind88	Ind88	Ind89	Ind89	Ind89	Ind90	Ind90	Ind90	Ind91	Ind91	Ind91	Ind92	Ind92	Ind92	Ind93	Ind93	Ind93	Ind94	Ind94	Ind94	Ind95	Ind95	Ind95	Ind96	Ind96	Ind96	Ind97	Ind97	Ind97	Ind98	Ind98	Ind98	Ind99	Ind99	Ind99	Ind100	Ind100	Ind100	Ind101	Ind101	Ind101	Ind102	Ind102	Ind102	Ind103	Ind103	Ind103	Ind104	Ind104	Ind104	Ind105	Ind105	Ind105	Ind106	Ind106	Ind106	Ind107	Ind107	Ind107	Ind108	Ind108	Ind108	Ind109	Ind109	Ind109	Ind110	Ind110	Ind110	Ind111	Ind111	Ind111	Ind112	Ind112	Ind112	Ind113	Ind113	Ind113	Ind114	Ind114	Ind114	Ind115	Ind115	Ind115	Ind116	Ind116	Ind116	Ind117	Ind117	Ind117	Ind118	Ind118	Ind118	Ind119	Ind119	Ind119	Ind120	Ind120	Ind120	Ind121	Ind121	Ind121	Ind122	Ind122	Ind122	Ind123	Ind123	Ind123	Ind124	Ind124	Ind124	Ind125	Ind125	Ind125	Ind126	Ind126	Ind126	Ind127	Ind127	Ind127	Ind128	Ind128	Ind128	Ind129	Ind129	Ind129	Ind130	Ind130	Ind130	Ind131	Ind131	Ind131	Ind132	Ind132	Ind132	Ind133	Ind133	Ind133	Ind134	Ind134	Ind134	Ind135	Ind135	Ind135	Ind136	Ind136	Ind136	Ind137	Ind137	Ind137	Ind138	Ind138	Ind138	Ind139	Ind139	Ind139	Ind140	Ind140	Ind140	Ind141	Ind141	Ind141	Ind142	Ind142	Ind142	Ind143	Ind143	Ind143	Ind144	Ind144	Ind144	Ind145	Ind145	Ind145	Ind146	Ind146	Ind146	Ind147	Ind147	Ind147	Ind148	Ind148	Ind148	Ind149	Ind149	Ind149	Ind150	Ind150	Ind150	Ind151	Ind151	Ind151	Ind152	Ind152	Ind152	Ind153	Ind153	Ind153	Ind154	Ind154	Ind154	Ind155	Ind155	Ind155	Ind156	Ind156	Ind156	Ind157	Ind157	Ind157	Ind158	Ind158	Ind158
CM009708.1_164	0	2	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.662254	0.331124	0.006623	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.666557	0.333276	0.000167	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.665965	0.332980	0.001055	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.662254	0.331124	0.006623	0.662254	0.331124	0.006623	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.888891	0.111108	0.000000	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.006623	0.331124	0.662254	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.666492	0.333243	0.000265	0.663157	0.331576	0.005268	0.662254	0.331124	0.006623	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.004189	0.331935	0.663876	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.941178	0.058822	0.000000	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.969698	0.030302	0.000000	0.333333	0.333333	0.333333	0.888891	0.111109	0.000000	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.663157	0.331576	0.005268	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.001115	0.998885	0.000000	0.662254	0.331124	0.006623	0.663157	0.331576	0.005268	0.333333	0.333333	0.333333	0.006623	0.331124	0.662254	0.663157	0.331576	0.005268	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.998051	0.001949	0.000000	0.333333	0.333333	0.333333	0.000529	0.333155	0.666316	0.663876	0.331935	0.004189	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.662254	0.331124	0.006623	0.333333	0.333333	0.333333	0.800000	0.199996	0.000004	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.663876	0.331935	0.004189	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.662254	0.331124	0.006623	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.333333	0.666110	0.333052	0.000839

Any idea what this issue is here? It doesn't work without --probs either,

/local/home/katrinac/ngsLD/ngsLD --geno /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/appc_angsd_probs.beagle.gz  --n_ind 159 --n_threads 40 --n_sites 6295181 --pos /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/appc_angsd_pos.txt --outH /data/katrinac/APPC_sequencing/DNA/trimmed_reads/mapping/genotypes/angsd/ngsld/appc_ngsLD.tsv    

=====
ERROR: [read_geno] cannot read GZip GENO file. Check GENO file and number of sites!
=====   

        : Numerical result out of range

Thank you!!

Without seeing more, I'd say the number of individuals/sites does not match.
How many indiv/sites do you have?

Ack yes, I was counting the GL header line- thanks for the quick response