X-lab2017/open-research

几个重点会议的论文规划和投稿:DASFAA、SIGIR、KDD

Opened this issue · 15 comments

类似咱们在 #229 中取得的成果(软件工程领域),开设此帖推动在数据科学领域会议的论文撰写与投稿工作~

除了最主要的 Research 轨道的论文,可以结合实验室特点,充分挖掘工业/实践类型、Demo 类型、数据集与评测类型等方面的论文投稿~ #199

1、DASFAA 2024(CCF B) #242

  • Industry Papers:January 25, 2024
  • Demo Papers:February 10

2、SIGIR 2024(CCF A)

3、KDD 2024(CCF A)

4、VLDB 2024(CCF A)

5、CIKM 2024(CCF B)

  • 参考去年:May ~ June
  • Research、Applied Research、Resource、Demo、AnalytiCup

例如,对于 KDD 的 ADS track,其中一个不错的 topic 就是:

  • Data and Benchmarking for Data Science Application Domains (including curation validation, and release of large-scale data, experiments, performance benchmarking)
  • Abstract Submission Deadline: Feb 1st 2024
  • Paper Submission Deadline: Feb 8th 2024

建议咱们的 OpenDigger 和 OpenPerf 两项重要工作可以考虑~ @xiaoya-yaya @bifenglin @PureNatural

@will-ww 王老师,我大概看了一下去年kdd ADS track的几篇论文,大多都是聚焦于某一个具体的方法,基准,以及相对很细的研究领域展开一些实验,最后得出结论。如果Opendigger仅仅是落脚在数据服务系统,那感觉投KDD太难了,因为给别人的感觉就是把数据集成在一起,然后给大家提供数据服务,我们能做其他人也能做,如果我们聚焦在数据服务上的话,就需要强调数据的独特性,我们中文的论文中有描述opendigger提出openrank和活跃度指标,如果我把openrank的实验搬过来,感觉又和openrank的那篇论文重叠的太多了,我现在就是在想怎么样才能让opendigger变的更独特一些,能有一些实验类的内容是最好的。
或者还是考虑投SCI期刊,从各方面相对KDD肯定还是会简单一些?

OpenPerf本身包含了大量实验,能给研究者提供基准参考,我认为没有上面问题的存在。

OpenPerf本身包含了大量实验,能给研究者提供基准参考,我认为没有上面问题的存在。

这个说法有道理的,所以我想,OpenDigger 其实是比较偏数据系统和数据服务的,那咱们是不是考虑投 DASFAA 的 Industry ,将 Frank 作为阿里、夏博作为蚂蚁,这样一个 B 类,也是非常好的,时间也正好~

再一个选择就是 SIGIR 的 Resource track,但感觉需要往它的主题上靠靠~

咱们前面没有录用的论文,可以考虑集中投一下 DASFAA 2024(CCF B) #242

其中长文投 Industry,本身咱们是工业界属性比较强的:@bifenglin

  • Uncover the Risks of Outdated Third-Party Components in Software Supply Chains: Insights from the NPM Ecosystem
  • Assessing Maintainability Risks in the Open Source Software Supply Chain: A Novel Quality Model Approach

Demo 和 数据集可以投 Demo(数据集论文需要做些展示,如可视化大屏,以符合 Demo 的要求):

  • StellarTop: An Integrated Multi-Topic Dataset on GitHub Repositories @Zzzzzhuzhiwei
  • Evaluating Open Source Project Influence based on NPM Ecology Dataset @frank-zsy @xiaoya-yaya @huangfan0
  • GHDU: A Comprehensive Dataset of GitHub Developer Information @zhicheng-ning
  • Global Insights for GitHub Developers: A Fine-Grained Geographic Dataset and Analysis @Peng99999
  • Sentiment Analysis in Code Annotation Comments on Github @PureNatural
  • 小技巧:因为 DASFAA 论文格式和长度的问题,上面的短文,如果觉得不错的,加点实验数据(或和其他论文做些组合),实际甚至都可以投 Industry 的长文了(12 页、单栏)~

最后,OpenLeaderboadOSGraph 其实也都不错的,如果有人愿意来写的话,挺好~

OSGraph 我可以来写,争取在假期前写完!

OpenLeaderboard 我可以试试~

我将之前的论文修改部分描述以及扩充一些可视化,投DASFAA的Demo试试~

OSGraph 我可以来写,争取在假期前写完!

这项工作可以邀请 @tyn1998 @frank-zsy 一起来帮忙整理,以及后续看看怎么和蚂蚁那边继续联动~ @xiaoya-yaya

OpenLeaderboard 我可以试试~

这项工作,可以邀请 @zhicheng-ning @PureNatural 一起来整理,以及联合2023 **开源年报的内容,后续看怎么来继续迭代新版本的 OpenLeaderboard~ @frank-zsy

我查了一下去年DASFAA的录用率,demo track 50%左右,industry Track 20%左右。

我把DASFAA去年的15篇左右Industry Paper都看了一下,感觉录用的论文基本上还是提出一个方法或者系统或者模型,然后证明该方法的有效性,实验部分也是围绕方法展开,例如速度方面提升多少等等,opendigger作为数据服务(没有实验支撑)的话,还是很难被录用,因此还是考虑投DaSE的SCI期刊,该期刊在今年升到了SCI 2区,质量也是不错的

投DASFAA industry track的同学,要注意从方法模型的角度去展开撰写可能更合适一些,以下是部分论文列表:

DASFAA 的两篇 Demo 文章已录用:

  • OSGraph: A Data Visualization Insight Platform for Open Source Community
  • Data Driven Visualized Analysis: Visualizing Global Trends of GitHub Developers with Fine-Grained Geo-details

感谢王老师 @will-ww 的支持和指导~~感谢frank学长 @frank-zsy 和小雅学姐 @xiaoya-yaya 以及韩博 @PureNatural 的帮助!

感谢王老师的支持和指导~@will-ww