AngelListを使用してスタートアップデータベースを構築する方法は2つあります。

最初の方法は簡単です。 最小限のプログラミングスキルが必要
AngelListには独自のRestful APIがあります 。 プログラミングスキルがない場合は、スキルのある人を見つけて、その人にタスクを委任することをお勧めします。 このソリューションはあなたの人生を大いに簡素化しますが、多くの仕事はありません。
1.アプリケーションを登録し、トークンを取得します。
2.次に、簡単にするために、GitHubから単純なPython ライブラリーをダウンロードします。
3.次に、トークンを指定します
4. getTagsStartupsメソッドを書き換えて、出力の次のページに移動できるようにします
def getTagsStartups(self, access_token = None, tag_id = None, page=None): self.check_access_token(access_token) if tag_id is None: raise AngelListError("the tag_id param is required for this api call.") return self.do_get_request('%s/1/tags/%s/startups?access_token=%s&page=%s' % (self.API_ENDPOINT, tag_id, self.access_token, page))
5.ロシアの企業の最初の発行でJSONを取得するには、getTagsStartupsメソッド(tag_id = '1677')を呼び出します。 他の国では、IDは異なる必要があります:フランスの場合は1717、ギリシャの場合は2215、シンガポールの場合は1682など。
6.問題となっているページの数を確認します
7.ページ数が判明した回数だけループ内のページパラメーターを使用してメソッドを呼び出し、すべてをファイルに並行して書き込みます。
できた 結果はjsonに保存されますが、これは非常に読みやすいものです。 誰かがそれをより便利な形式に変換する方法を見つけたら、コメントでこれを見るのは素晴らしいことです。
2番目の方法は苦痛です。 忍耐が必要

スタートアップImport.ioがあります。 同社は、サイトから情報をスクレイピングするための無料のアプリケーションを提供しています。 このサイトには、AngelListを使用して従業員に関する情報を収集する方法に関する詳細な手順があります。
最初の方法はすでに問題をうまく解決していたので、アプリケーションで1時間作業した後、私はあきらめました。 わずか50社を引き抜くことができました。 しかし、ピアリングすると、プロセスは速くなります。 いずれにせよ、彼らは製品に取り組んでいます。 アプリケーションがより良く機能することを望みましょう。
UPD Megamindリーダーは、.csv形式で100社をアップロードできる別の方法を共有しました。 angel.co/companies企業のリストにエクスポートボタンがあります。

残念ながら、csvにはjsonほど情報がありません。 特に、csvには企業の説明と連絡先情報はありません。