VMware Workstation や vSphere ESXi は母艦となる物理マシンで Hyper Threading / HT が有効になっている場合は
その HT 1 スレッドを論理 CPU 1 コアとして扱い、1 vCPU のリソースとなります。
そのため、"VMwareにはハイパースレッディングの考えは無いんですよね?" の問いに対しては、
HT 有効な物理マシン上での vCPU は HT 1 スレッド分のリソース、
HT 無効な物理マシン上での vCPU は 物理 1 コア分のリソースが割り当てられることになります。
但し、物理マシンの HT で払い出される vCPU リソースは同時に別の VM に割り当てられることはなく、1 VM に 2 vCPU 割り当てられている場合にのみ同時に 2 スレッド分の vCPU が消費されます。※ 先の Blog の "物理 CPU Core と vCPU の割り当ての関連性" を参照願います。

> もし物理PCのパフォーマンスに極限に近づけるなら、
> ゲストPCでは、
> プロセッサ数 : 2
> プロセッサごとのコア数 : 8
> 合計プロセッサ コア : 16
> になるんでしょうか?
構成上、上記は組めるのですが実際には母艦側の様々な CPU 処理で利用されるリソースが割り込むため、
母艦の全リソースを VM に割り当ててしまうのは健全ではありません。
恐らく、高い負荷を VM 側で要求する場合には母艦側でもある程度の CPU 要求があるため CPU 処理の待ちに割り込みが多々発生して VM の性能が低下する可能性が高くなります。
Workstation の CPU 割り当ての仕組みとは恐らく異なるアーキテクチャとなりますが、
こちらも先の Blog の "vCPU は必要性能と物理 CPU に見合った適切な数を割り当てる" の項と、"ESXi ホストの CPU 負荷の上限について" の項に
高い負荷が発生している時の物理 CPU リソースと仮想 CPU リソースの関係を簡易的にですがイラストとグラフで表現しているのでイメージが付きやすいかと思います。
> しかし4台作成という条件だから、
> 4で割って1台あたり「合計プロセッサ コア : 4」という計算なのでしょうか?
はい、上記の計算がベースとなりますが、1 VM に 16 vCPU をまとめて割り当てる場合より、1 VM 4 vCPU 構成を 4 VM 用意する方が CPU の割り当てスケジューリングに柔軟性が生まれるので 4VM 構成の方が母艦側の CPU 処理割り込みを上手くコントロールできると考えています。
経験上、1 物理 PC に 1 VM のみ動作させる場合でも、10% ~ 20% の CPU の余裕は持たせたサイジングが安定のためにはお奨めかなと思います。
後はそれぞれの構成でのベンチマークをとってみる、ですかね。
ご参考まで、、、