[REDMINE1D-227] [RM-6176] Classification S/G - Vipers Created: 05/Jul/23  Updated: 19/Sep/23  Resolved: 06/Sep/23

Status: Done
Project: 1D Redmine
Component/s: None
Affects Version/s: None
Fix Version/s: None

Type: Task Priority: Normal
Reporter: Redmine-Jira Migtation Assignee: Redmine-Jira Migtation
Resolution: Done Votes: 0
Labels: None
Remaining Estimate: Not Specified
Time Spent: Not Specified
Original Estimate: Not Specified

Attachments: File Datamine_VIPERS_run_Matthieu.ipynb     PNG File GSprobas_missedStars2.png     File redshift.csv     File starsRef.csv     PNG File zflag_missedStars.png     PNG File zgalaxies_starsAsGalaxies_vipers.png     PNG File zGalaxies_stars.png    

 Description   

Created on 2020-12-08 10:01:11 by Mira Sarkis. % Done: 100

  • Faire un nouveau run
    • avec Zstars = [-3E-3; 3E3] (hardcoded)
    • sur des données vipers qui sont de bonne qualité et plus réaliste, qui contiennent un mélange d'étoiles et de galaxies.
    • peut-etre sur des données SC8 si on les récoit en Janvier?
  • Produire une matrice de confusion:
    • pour les stars pris pour des galaxies, regarder les valeurs des redshifts trouvés (Zgalaxie)
  • Envoyer un fichier récap. des résultats de ces runs
    • se mettre d'accord avec Mathieu sur le format et les colonnes de ce document


 Comments   
Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Mira Sarkis on 2021-02-03 09:23:21:
Premiers résultats du run sur les données Vipers (pas de données SC8 convenables):

  • Répertoire de sortie: /net/CESAM/nas10c/scratch/msarkis/vipers/output_6246_2Feb_GSClassification
  • Résultats obtenus pour 58974 spectres.
  • Matrice de confusion normalisée (Total: 1057 étoiles et 57917 galaxies):
    Normalized Stars Galaxy
    Star_Label 0.559 0.025
    Galaxy_Label 0.441 0.975
  • Pour les stars pris pour des galaxies, en pièces-jointes des plots sur les valeurs des redshifts trouvés (Zgalaxie).
    Les Zgalaxies prennent des valeurs de 10-2 à 4.9999
Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Mira Sarkis on 2021-02-03 09:35:19:
Je joins aussi:

  • le fichier de sortie redshift.csv et
  • la liste des spectres des vraies étoiles (extraite à partir de /net/GECO/users/vlebrun/VIPERS-W1/aspic_vipers_dr2_w1_catalog.txt )
Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Vincent Le Brun on 2021-02-03 11:09:51:
OK donc on est bon pour reconnaitre les galaxies, c'est plutôt bien...

Pour les étoiles, il faudrait donner la répartition en fonction du flag de confiance (z_flag) parce que si on ne se trompe que pour les spectres pourris c'est pas grave...

Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Didier Vibert on 2021-02-03 11:30:31:
Vincent LE BRUN wrote in #note-5:
> OK donc on est bon pour reconnaitre les galaxies, c'est plutôt bien...
>
> Pour les étoiles, il faudrait donner la répartition en fonction du flag de confiance (z_flag) parce que si on ne se trompe que pour les spectres pourris c'est pas grave...

à regarder aussi avec les évidences ou proba respectives...

Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Mira Sarkis on 2021-02-03 15:31:43:
Pour les "mis-classified stars" :

  • Je vous joins un plot de leurs zflags:
    • zflags allant de 1.2 à 4.2
  • Pour les probaG/S: (c'était la galère pour récupérer les résultats de la classification depuis hdf5. Il faut surement ajouter ces données au redshift.csv final)
    • je vous joins un plot des proba des galaxies et proba des stars. 98.5% des spectres de "mis-classified stars" ont une probaGalaxy>=0.8 .

Pour info: jupyter notebook içi: /net/CESAM/amazed/msarkis/vipers/starClassificationAnalysis.ipynb

Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Matthieu Bethermin on 2021-02-05 09:49:17:
Merci Mira.

Je viens de regarder de mon côté. On fait un bon boulot pour ne pas perdre de galaxies et celles qu'on perd ont tendance à avoir un merit bas. Par contre pour les étoiles c'est vraiment 50-50 et il n'a a rien de franc en terme de merit. Par conter, ces étoiles finissent en grande majorité à bas z ou autour de z=3 (je suis moins sûr de comprendre). Donc, elles ne vont pas perturber l'échantillon spectro Euclid qui est entre 0.9 et 1.8.

J'ai demandé à Vincent les true redshift des galaxies pour savoir lesquels finissent par erreur en étoiles. Si c'est que du bas z, ça ne sera pas un problème. Je posterai le notebook quand j'aurais fini cette partie.

Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Vincent Le Brun on 2021-02-05 16:11:53:
z=3 correspond au break lyman (ou lyman alpha) confondu avec le break à 4000 des étoiles ...
faut voir aussi si ça correspond à un type donnée d'étoiles dont on aurait pas le template

Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Matthieu Bethermin on 2021-02-05 16:49:56:
Bon, je confirme que les quelques galaxies mal classifiées sont surtout à bas z et ce n'est pas piloté par le distribution en z de VIPERS. J'ai attaché le notebook où j'ai fait quelques plots.

Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Vincent Le Brun on 2021-12-14 14:04:45:
en attente de la correction du ticket #6875 (gestion de la LSF) et du #6503 (evidence star/galaxies)

Comment by Redmine-Jira Migtation [ 19/Sep/23 ]

Comment by Vincent Le Brun on 2023-09-05 14:40:29:
vu la qualité des spectres (ou plus exactement de celle du spectre de bruit) je pense qu'il ne faut pas trop en demander à la classification.

Generated at Sat Feb 10 15:30:35 JST 2024 using Jira 8.3.4#803005-sha1:1f96e09b3c60279a408a2ae47be3c745f571388b.